聯(lián)系官方銷售客服
1835022288
028-61286886
采集工具:火車采集器(可以百度搜索一下這個(gè)工具的下載)
采集模塊:新聞 News
第一步、編寫采集入庫腳本接口
新建:/api/caiji.php (應(yīng)用于URL地址請(qǐng)求,大小寫隨意)
如果根目錄沒有api文件夾,就創(chuàng)建到 /public/api/caiji.php (應(yīng)用于URL地址請(qǐng)求,大小寫隨意)
新建:./dayrui/My/Api/Caiji.php(首字母必須大寫,最終php文件命名與上面的名稱保持相同)
腳本文件中可以定義發(fā)布者等一些預(yù)定義字段默認(rèn)值,如果你不會(huì)php的話可以保持默認(rèn)
注意:本腳本的程序代碼只對(duì)內(nèi)容等字段入庫有效,由于采集目標(biāo)網(wǎng)站的數(shù)據(jù)規(guī)范性無法做到統(tǒng)一;
如果開發(fā)者對(duì)其他字段(例如多文件上傳、復(fù)選框、聯(lián)動(dòng)字段等等)需要開發(fā)者自己根據(jù)采集的實(shí)際情況來編寫入庫程序來組裝入庫的POST數(shù)據(jù),需要PHP開發(fā)技術(shù)基礎(chǔ),下面來舉一些基礎(chǔ)例子。
1、多文件上傳字段
2、復(fù)選框字段
測試規(guī)則地址:
如果能顯示出來欄目信息,說明ok了
如果顯示api file is error,表示你./dayrui/My/Api/Caiji.php沒有創(chuàng)建正確。
第二步、火車采集器編寫web發(fā)布規(guī)則
第三步、新建一個(gè)在線發(fā)布模塊
第四步、填寫獲取欄目列表的參數(shù)
按照上面的格式寫就ok了
第五步、內(nèi)容發(fā)布規(guī)則參數(shù)
表單參數(shù):這里可以配置任意自定義字段的入庫,不知道入庫格式怎么辦?
查看數(shù)據(jù)庫儲(chǔ)存數(shù)據(jù)格式進(jìn)行入庫處理,必要時(shí)需要在接口文件中重新編程
第六步、保存模塊
第七步、然后返回web發(fā)布配置里面
按照?qǐng)D中的參數(shù)配置,點(diǎn)“獲取欄目”,如果可以獲取到就表示成功了一大半了
第八步、測試入庫發(fā)布
第九步、后臺(tái)查看采集內(nèi)容
火車頭采集器設(shè)置檢測標(biāo)題重復(fù),重復(fù)標(biāo)題不能發(fā)布,怎么暫時(shí)關(guān)閉標(biāo)題重復(fù)檢測。需要?jiǎng)h除那里面的函數(shù)代碼?
咱們這個(gè)程序可以批量導(dǎo)入文章嗎?或者有啥插件沒
強(qiáng)烈建議官方出來個(gè)采集插件~在站內(nèi)就能完美采集。
按照火車頭內(nèi)容采集范例這個(gè)教程第一步獲取欄目實(shí)現(xiàn)了,到第二部用用戶名和密碼登錄的時(shí)候出現(xiàn)錯(cuò)誤是什么問題?。?/p>
我按照教程制作的火車頭發(fā)布模塊,發(fā)布的時(shí)候,火車頭運(yùn)行記錄那里出現(xiàn)紅色字樣,搞不懂是我哪里錯(cuò)了嗎?我看發(fā)布是成功了。
官網(wǎng)的多網(wǎng)站系統(tǒng),使用火車頭采集器,無法獲取主站之外的其他站點(diǎn)的分類,無法發(fā)布到內(nèi)容。切換到其他站點(diǎn)后臺(tái),看到有火車頭采集插件,然后拷貝了dayrui,My2個(gè)目錄,把插件也拷貝到了其他站點(diǎn)的站點(diǎn)目錄