功能項 | 功能描述 |
---|---|
元搜索采集 | 從百度、谷歌、必應(yīng)采集 ,參見 SI-16 SI-26 |
網(wǎng)站爬蟲采集 | 從網(wǎng)站爬取數(shù)據(jù),自動智能識別標(biāo)題、正文、時間,自動過濾廣告和導(dǎo)航欄 ,參見 SI-18 SI-28 |
論壇采集 | 自帶多個模板,支持定制模板 ,參見 SI-17 SI-27 |
百度貼吧采集 | 通過關(guān)鍵詞搜索并采集百度貼吧內(nèi)容 ,參見 SI-22 SI-32 |
微信公眾號采集 | 通過關(guān)鍵詞搜索并采集微信公眾號符合條件的內(nèi)容 ,參見 SI-23 SI-33 |
本地文件采集 | 在本地計算機采集文件,支持ZIP、RAR壓縮文件(無密碼) |
數(shù)據(jù)處理 | 清洗、整合、標(biāo)準(zhǔn)化等處理 |
全文提取 | 支持一百多種文件文件格式,提取全文文本 |
標(biāo)題與正文智能提取 | 無需配置模板,智能識別與提取標(biāo)題和正文,自動去除導(dǎo)航欄、廣告等無效信息 |
全文檢索 | 支持所有文本內(nèi)容的全文搜索 |
全文檢索 | 在全文中搜索、自動摘要等 |
智能分類 | 自動識別語義,按照設(shè)置樣本對文件進行分類 |
自然段整合 | 跨文章將相似自然段整合一起 |
知識庫設(shè)置 | 將經(jīng)驗知識、案例知識、有價值文字設(shè)置為知識庫 |
正則表達式抽取 | 輸入正則表達式,根據(jù)模式自動抽取符合規(guī)律的未知內(nèi)容 |
獨特優(yōu)勢 | (1) 內(nèi)置精準(zhǔn)語義引擎的按需采集型軟件,采集下來的文章幾乎100%符合需求,而不是像市場同行一樣95%數(shù)據(jù)都是垃圾文檔
(2) 無需配置模板,自動提取標(biāo)題、時間和正文,自動過濾導(dǎo)航欄和廣告 |
服務(wù)項 | 服務(wù)描述 |
---|---|
SDK | 有,免費提供,包括JAVA、C++、C# |
示例源碼 | 有,免費提供 |
技術(shù)指導(dǎo) | 有,免費提供 |
定制開發(fā) | 可,議價 |
項目承建 | 可,議價 |
場景項 | 場景描述 |
---|---|
競爭情報保障 | 設(shè)置競爭情報課題,持續(xù)監(jiān)控競爭情報信息 |
專題情報保障 | 設(shè)置專題情報課題,持續(xù)監(jiān)控競爭情報信息 |
知識庫保障 | 構(gòu)建知識庫,將案例知識、經(jīng)驗知識、有價值文字設(shè)置為知識庫 |
輿情監(jiān)控 | 監(jiān)控自媒體、社交媒體 |
智庫建設(shè) | 輔助智庫建設(shè),提供數(shù)據(jù)采集與分析系統(tǒng) |
示例項 | 示例圖片 |
---|---|
軟件界面 | ![]() |
產(chǎn)品 | 頁面鏈接 |
---|---|
身份證解碼類 | 身份證解碼類產(chǎn)品 |
計算機視覺類 | 計算機視覺類產(chǎn)品 |
大數(shù)據(jù)情報類 | 大數(shù)據(jù)情報類產(chǎn)品 |
全部產(chǎn)品列表 | 全部產(chǎn)品列表 |
拳頭產(chǎn)品 ![]() |
拳頭優(yōu)勢產(chǎn)品清單 |