防止文章被抄襲的網路分析軟體

來源:互聯網
上載者:User

很多Blogger都遇到過自己文章被其他人抄襲剽竊的情況,為了讓大家能快速將惡意轉載抄襲者找出來,我根據搜尋引擎的一些原理,利用百度搜尋引擎的資料,開發了一個可以自動分析尋找那些對自己有“實質傷害”的抄襲者的地址。

  這是一個獨立的可執行檔程式,完全免費,基於ACCESS資料庫,目前支援Z-Blog系統,其實支援其他ASP的Blog修改也很簡單,有需要的可以聯絡一下我。(註:其他Blog程式的使用方法:先建立一個Access檔案,然後建立一個表,表名為blog_Article,表中增加欄位log_ID和log_Title,log_ID為自動編號,log_Title為文章標題,然後將你Blog上的文章標題都複製過來,一篇文章對應一條記錄,只複製標題即可,然後在本程式中選擇這個資料庫)

  資料採礦我是直接通過調用搜尋引擎來實現的。原先打算使用Java下調用Google SOAP API來實現,不過不知什麼原因,Google SOAP API搜尋英文沒有任何問題,一搜尋中文就報數組超界,不知道什麼原因。只好去調用百度的搜尋引擎。

  百度的搜尋引擎沒有API,不過我還是有辦法間接調用的。調用的時候發現中文的確沒有什麼問題,也沒有錯誤,很順利就調通了程式。

  我目前搜尋的時候,採用了“實質傷害”這個概念,因為目前文章轉載的情況會非常多,每一個都去處理會很麻煩。因此我們只去尋找情況惡劣的即可。這個可以通過搜尋引擎排名來實現。只尋找那些轉載地址對於原文影響最壞的。

  這個程式使用起來很簡單,先選擇資料庫檔案,再選擇Z-Blog系統,然後填寫你自己的網域名稱,點搜尋即可開始執行。搜尋完成後會自動產生一個名為list.txt的檔案,就是搜尋結果。此程式對於部分標題的文章會有誤判,最好文章標題個人化濃一些。軟體的介面看起來不是很好,因為我沒有美工嘛。

  點擊下載軟體:轉載文章搜尋器

相關文章

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.