聯(lián)系官方銷售客服
1835022288
028-61286886
火車頭多圖采集的設置方法用于多文件和圖片專用字段
轉(zhuǎn)發(fā)的
相信很多剛開始學習火車頭的菜鳥們,也和爛泥一樣使用的是火車頭免費版,然后為我們的zencart網(wǎng)站進行一些產(chǎn)品數(shù)據(jù)的采集。但是在寫采集規(guī)則的時候,會經(jīng)常碰到的一個問題就是如何采集一個產(chǎn)品的多張圖片。
采集一張圖片的規(guī)則,相信大家都會寫了。那么多張圖片呢?如何寫呢?其實,這個和我們寫采集一張圖的是一樣的,只是在一些細節(jié)上面設置正確就ok了。下面我就自己采集的一個站點給各位做一下講解。
我們知道要采集一個網(wǎng)站的圖片,那么我們肯定是在火車頭使用img標簽來進行的。
要采集多張圖片,我們肯定要找出來這些圖片在源碼中的代碼。我下面舉例來進行講解:
在上圖中是標記出來的1和2是兩張不同的圖片,但是我們仔細的觀察可以發(fā)現(xiàn)img標簽中,如果把圖片的源地址和alt去掉的話,那么其他的都是一樣的。而火車頭有一個標簽循環(huán)使用的功能,這就為我們采集多張圖片提供了一個方便。我現(xiàn)在把源碼粘貼出來:
<img src="域名/_img/PRODUCTS/320/PromGirl-767611310.jpg" width="68" border="0" alt="Long One Shoulder Formal Dress P641 TI-P641" />
然后在火車頭中進行采集規(guī)則的編寫:
在數(shù)據(jù)提取方式中,我們選擇了“正則提取”,而“正則匹配內(nèi)容”中填寫如下:
<img src="域名/_img/PRODUCTS/[參數(shù)]/[參數(shù)]"(*)width="(*)"(*)border="(*)"(*)alt="(*)"(*)/>
組合結果中填寫如下:
<img src="域名/_img/PRODUCTS/[參數(shù)1]/[參數(shù)2]"/>
其中正則匹配內(nèi)容第一個“參數(shù)”對應的是組合結果中的“參數(shù)1”,正則匹配內(nèi)容第二個“參數(shù)”對應的是組合結果中的“參數(shù)2”,而其中的“*”是任意匹配的意思。
上圖是設置好后,采集測試的結果
這個是導出的結果。
Ok,以上我們可以看到要采集多張圖片,只要我們設置好了采集標簽,然后此標簽可以循環(huán)使用,就可以達到我們要的結果了……
哎,你這個太麻煩了,根本不需要存到本地,直接入庫,調(diào)用系統(tǒng)接口直接入庫就行,他會自己存到本地,后臺配置了七牛云什么的,會上傳到七牛云
回復@www.18html.com
回復@琉惗
該文章來源于網(wǎng)絡,
這里我想表達的是,如何采集多圖,
而不是入庫,入庫我還沒寫!
入庫是不需要采集的!
后面再寫怎么入庫
回復@www.18html.com ?? 想看看是什么
回復@www.18html.com 學習學習
回復@www.18htm此內(nèi)容需要回復后才能看到********l.com