網(wǎng)絡(luò)文學(xué)頻遭“秒盜” 文學(xué)網(wǎng)站升級(jí)防盜新技術(shù)
作 者:任曉寧 來(lái) 源:中國(guó)新聞出版廣電報(bào)發(fā)表日期:2018-03-08
閱文集團(tuán)上線了特殊算法模型數(shù)據(jù)庫(kù),已實(shí)現(xiàn)快速查詢底層能力,秒級(jí)內(nèi)實(shí)時(shí)計(jì)算出指定章節(jié)內(nèi)容重復(fù)度,為防抄襲提供大數(shù)據(jù)基礎(chǔ)能力。
晉江文學(xué)城設(shè)計(jì)了一套抄襲舉報(bào)管理系統(tǒng),自系統(tǒng)上線以來(lái),已累計(jì)受理用戶舉報(bào)抄襲文章4000余次,共成功處理抄襲文章2000余篇。
分級(jí)自動(dòng)化內(nèi)容防盜系統(tǒng)是根據(jù)對(duì)盜文者行為模式的分析,制定對(duì)應(yīng)的防盜規(guī)則,付費(fèi)章節(jié)作者可以設(shè)定對(duì)某些特定人群在一定時(shí)間內(nèi)投放干擾性閱讀內(nèi)容,從而起到一定的防盜作用。
盜版、抄襲現(xiàn)象是阻礙網(wǎng)絡(luò)文學(xué)發(fā)展的沉疴。據(jù)不完全統(tǒng)計(jì),每年網(wǎng)絡(luò)文學(xué)行業(yè)因盜版損失接近100億元。近一段時(shí)間以來(lái),閱文集團(tuán)、晉江文學(xué)城等紛紛升級(jí)防盜版措施,把大數(shù)據(jù)、云計(jì)算等互聯(lián)網(wǎng)新興技術(shù)應(yīng)用到防盜版、防抄襲上,技術(shù)手段有了進(jìn)展。
《中國(guó)新聞出版廣電報(bào)》記者了解到,閱文集團(tuán)針對(duì)抄襲行為上線了特殊算法模型數(shù)據(jù)庫(kù),實(shí)時(shí)查重作家上傳的作品內(nèi)容。晉江文學(xué)城通過(guò)技術(shù)手段,付費(fèi)章節(jié)作者可以設(shè)定對(duì)特定人群在一定時(shí)間內(nèi)投放干擾內(nèi)容,起到了一定的防盜版作用。
特殊算法
實(shí)現(xiàn)網(wǎng)絡(luò)文學(xué)秒級(jí)查重
“去年,我們基于自己的數(shù)據(jù)庫(kù)開(kāi)發(fā)了一整套特殊算法模型數(shù)據(jù)庫(kù),在編輯后臺(tái)可以直觀地比對(duì)作者的文本是否有抄襲,雖然增加了服務(wù)器壓力,但是我覺(jué)得很值得。”閱文集團(tuán)旗下起點(diǎn)中文網(wǎng)總編輯李曉亮這樣告訴記者。
當(dāng)前,這套針對(duì)抄襲行為上線的特殊算法模型數(shù)據(jù)庫(kù)已經(jīng)在整個(gè)閱文集團(tuán)平臺(tái)應(yīng)用,在這個(gè)系統(tǒng)支持下,編輯可以實(shí)時(shí)查重作者上傳的作品內(nèi)容。作者每發(fā)一章,平臺(tái)就可以自動(dòng)對(duì)比全網(wǎng)書庫(kù),提醒編輯本章與書庫(kù)中內(nèi)容的重復(fù)率,以便人工查驗(yàn)是否抄襲,當(dāng)重復(fù)率超過(guò)50%時(shí),平臺(tái)就會(huì)自動(dòng)報(bào)警,該做法有效解決了抄襲現(xiàn)象。
“如果抄襲嚴(yán)重,我們會(huì)直接禁了作者權(quán)限。”李曉亮說(shuō)。
據(jù)了解,目前閱文集團(tuán)已實(shí)現(xiàn)快速查詢底層能力,秒級(jí)內(nèi)實(shí)時(shí)計(jì)算出指定章節(jié)內(nèi)容重復(fù)度。這種特殊算法模型根據(jù)有效命中段落數(shù)、作品總有效段落數(shù)加權(quán)計(jì)算單章節(jié)重復(fù)度,并根據(jù)單章節(jié)重復(fù)度計(jì)算作品總重復(fù)度。為了建立最專業(yè)的防抄襲監(jiān)控體系,閱文集團(tuán)通過(guò)歷年深耕,已積累千萬(wàn)級(jí)的作品基礎(chǔ)數(shù)據(jù),有效章節(jié)數(shù)達(dá)1.5億,有效段落數(shù)達(dá)數(shù)百億,為防抄襲提供大數(shù)據(jù)基礎(chǔ)能力。
對(duì)于效果,李曉亮表示滿意,“這個(gè)措施還是有用的,每章剛一出現(xiàn),就能發(fā)現(xiàn)是否有抄襲嫌疑了。”他認(rèn)為,這個(gè)功能可以降低內(nèi)容監(jiān)管風(fēng)險(xiǎn)、提高人工審核效率。
舉報(bào)管理系統(tǒng)
警示抄襲行為
對(duì)于抄襲,晉江文學(xué)城在業(yè)內(nèi)一直是態(tài)度鮮明的持續(xù)打擊,無(wú)論是小透明還是網(wǎng)絡(luò)大神,凡是有確鑿證據(jù),一律按照相關(guān)規(guī)定處理。記者了解到,晉江文學(xué)城目前設(shè)計(jì)了一套抄襲舉報(bào)管理系統(tǒng),自系統(tǒng)上線以來(lái),已累計(jì)受理用戶舉報(bào)抄襲文章4000余次,共成功處理抄襲文章2000余篇。
晉江文學(xué)城的抄襲舉報(bào)管理系統(tǒng)主要有“用戶前臺(tái)舉報(bào)”端及“管理員后臺(tái)處理”端兩大部分,同時(shí)為便于后續(xù)處理,又將舉報(bào)抄襲分為“全文照搬”“文字抄襲”“劇情抄襲”三大類。
對(duì)于用戶提供的抄襲證據(jù),系統(tǒng)會(huì)根據(jù)文章數(shù)據(jù)庫(kù)再次進(jìn)行核實(shí),尤其是在文字抄襲和全文照搬的處理上,基于晉江文學(xué)城判定標(biāo)準(zhǔn),系統(tǒng)會(huì)將抄襲文章和被抄襲文章的雷同語(yǔ)段進(jìn)行特殊標(biāo)識(shí),并進(jìn)行雷同語(yǔ)段統(tǒng)計(jì),減少人工判斷的難度。針對(duì)劇情抄襲,系統(tǒng)會(huì)將抄襲對(duì)應(yīng)章節(jié)進(jìn)行箭頭指向引導(dǎo)展示,便于處理者能夠更加明確地查看到對(duì)應(yīng)關(guān)系。
對(duì)于被判定了抄襲的文章,晉江文學(xué)城會(huì)做出對(duì)應(yīng)的懲罰措施,舉報(bào)者也會(huì)得到舉報(bào)成功的獎(jiǎng)勵(lì),以此來(lái)激勵(lì)更多的用戶加入到反抄襲、維護(hù)原創(chuàng)作者權(quán)益的隊(duì)伍中,同時(shí)也對(duì)作者們起到一定的警示作用,保持晉江文學(xué)城這一片創(chuàng)作凈土。
內(nèi)容防盜系統(tǒng)
初步實(shí)現(xiàn)防盜目的
2017年度,晉江法務(wù)部聯(lián)合熱心作者、讀者做了大量的反盜版維權(quán)工作,為作者追回近千萬(wàn)元的經(jīng)濟(jì)損失,并將兩家公司納入失信被執(zhí)行人名單進(jìn)行信用懲戒。在技術(shù)手段上,晉江也上線了分級(jí)自動(dòng)化內(nèi)容防盜系統(tǒng)和盜文侵權(quán)行為通知函件自動(dòng)發(fā)送系統(tǒng)。
分級(jí)自動(dòng)化內(nèi)容防盜系統(tǒng)是根據(jù)對(duì)盜文者行為模式的分析,制定對(duì)應(yīng)的防盜規(guī)則,付費(fèi)章節(jié)作者可以設(shè)定對(duì)某些特定人群在一定時(shí)間內(nèi)投放干擾性閱讀內(nèi)容,比如24—72小時(shí)內(nèi),只有購(gòu)買一定比例的VIP讀者才能看到最新內(nèi)容,否則只能看到之前的舊內(nèi)容,從而起到一定的防盜作用。盜文侵權(quán)行為通知函件自動(dòng)發(fā)送系統(tǒng)是讓作者通過(guò)該系統(tǒng)向指定侵權(quán)網(wǎng)站聯(lián)絡(luò)郵箱發(fā)送侵權(quán)通知函件,要求將侵權(quán)作品進(jìn)行下架刪除等處置,同時(shí)系統(tǒng)會(huì)記錄并分析相應(yīng)數(shù)據(jù),便于網(wǎng)站法務(wù)部門人員查看,達(dá)到一定程度后,會(huì)有法務(wù)人員人工介入處理。
2017年,晉江文學(xué)城多次就抄襲、盜版問(wèn)題發(fā)起過(guò)訴訟,大部分案件獲得較好的維權(quán)結(jié)果。比如百度閱讀侵犯晉江作者玖月晞的《親愛(ài)的阿基米德》《一座城,在等你》作品著作權(quán)案,目前已經(jīng)獲得一審判決,其維權(quán)行為得到法院認(rèn)可。
“在反盜版上,我們也一直致力于在盡量不影響絕大多數(shù)正常讀者用戶體驗(yàn)的基礎(chǔ)上,提升網(wǎng)站各種防盜手段。但上述技術(shù)手段只能起到部分作用,在此基礎(chǔ)上,我網(wǎng)站法務(wù)人員也付出了很大努力。”晉江文學(xué)城副總裁劉旭東認(rèn)為,網(wǎng)絡(luò)文學(xué)的抄襲、盜版問(wèn)題一直比較嚴(yán)重,也是制約行業(yè)健康發(fā)展、侵害作者和文學(xué)網(wǎng)站權(quán)益的最重要問(wèn)題之一。抄襲問(wèn)題更多的是一種道德品質(zhì)層面的問(wèn)題,需要作者自覺(jué)自律,需要網(wǎng)站公平公正的處理。而盜版問(wèn)題,危害重,維權(quán)難,一直深受詬病,但鑒于網(wǎng)絡(luò)文學(xué)這種線上閱讀的模式,除非不讓讀者閱讀,否則以現(xiàn)有技術(shù)水平來(lái)說(shuō),很難徹底根除盜版現(xiàn)象,畢竟還有“手打團(tuán)”這種盜版方式的存在,因此各級(jí)網(wǎng)站、各位作者也只是盡可能地增加盜版難度,降低侵害。
起點(diǎn)中文網(wǎng)則主要通過(guò)禁止復(fù)制作品內(nèi)容,以及停權(quán)盜帖賬號(hào)這兩個(gè)辦法來(lái)反盜版,盡管也取得不小的反盜版成果,李曉亮對(duì)此依然提出困惑,“只要盜版網(wǎng)站投入的成本達(dá)到一個(gè)很低的門檻,我們基本就無(wú)能為力了。”他認(rèn)為,這也是當(dāng)前正版文學(xué)網(wǎng)站一段時(shí)間內(nèi)持續(xù)面臨的困境。
- 相關(guān)文章
-