SmR 通用資訊採集系統(新聞小偷)

來源:互聯網
上載者:User
SmR 通用資訊採集系統(新聞小偷) 

    SmR beta1(全稱:SoFia Message Request)通用Web資訊擷取系統,該系統目前售價RMB1000.00

  1、準系統: 

1.1採集規則設定 
  添加項目智能化,實現了自動在後台對規則進行轉換,從而避免書寫複雜的Regex。

  1.2資料擷取
  對預定的項目進行採集,可以分兩種方式進行:快速採集和穩定採集;快速採集不預覽,直接採集,四個小時可以採集10000條資料左右,穩定採集會在採集的同時瀏覽到新聞的內容,速度要慢一些。
  
  1.3過濾設定 
  設定額外的過濾和替換操作,設定分為普通替換和進階替換,普通替換可以將簡單的內容替換成自己的內容,進階替換通過Regex,將新聞中那些複雜的冗餘的內容替換掉。

  1.4記錄 
  對採集過的內容儲存為記錄,避免重複和消耗資源。

  2、特色功能:

  2.1分類管理
  對本地分類進行管理,可以滿足多個來源到不同分類的需求。同時,每個分類下載的檔案可以放到各自訂好的目錄,便於不同位置的發布。克服了目前許多缺陷。
  2.2資料審核 
  可以部分和完全選擇是否發布採集資料。
  2.3資料匯出 
  可以通過簡單的填寫資料庫名稱,選擇需要匯入的表就能完成匯出,操作異常簡單。
  2.4資料維護 

  3、使用協助 
  參見系統中“使用協助”頁面。

 

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.