我們嘗試獲取表的信息,這里,我們就用某校的課表來代替:
接下來我們就上代碼:
a.php
?php header( "Content-type:text/html;Charset=utf-8" ); $ch = curl_init(); $url ="表的鏈接"; curl_setopt ( $ch , CURLOPT_USERAGENT ,"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/53.0.2785.113 Safari/537.36" ); curl_setopt($ch,CURLOPT_URL,$url); curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1); $content=curl_exec($ch); preg_match_all("/td rowspan=\"\d\">(.*?)\/td>\ntd rowspan=\"\d\">(.*?)\/td>td rowspan=\"\d\" align=\"\w+\">(.*?)\/td>td rowspan=\"\d\" align=\"\w+\">(.*?)\/td>td>(.*?)\/td>\ntd>(.*?)\/td>td>(.*?)\/td>/",$content,$matchs,PREG_SET_ORDER); //匹配該表所用的正則 var_dump($matchs);
然后咱們就運(yùn)行一下:
成功獲取到課表;
絕對(duì)鏈接
我們以百度圖庫的首頁為例
b.php
?php header( "Content-type:text/html;Charset=utf-8" ); $ch = curl_init(); $url="http://image.baidu.com/"; curl_setopt ($ch , CURLOPT_USERAGENT ,"Mozilla/5.0 (Windows NT 10.0; Win64; x64)AppleWebKit/537.36 (KHTML, like Gecko) Chrome/53.0.2785.113 Safari/537.36" ); curl_setopt($ch,CURLOPT_URL,$url); curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1); $content=curl_exec($ch); $string=file_get_contents($url); preg_match_all("/img([^>]*)\s*src=('|\")([^'\"]+)('|\")/", $string,$matches); $new_arr=array_unique($matches[3]); foreach($new_arr as $key) { echo "img src=$key>"; }
然后,我們就獲得了下面的頁面:
相對(duì)鏈接
百度圖庫的圖片的鏈接大部分是絕對(duì)鏈接,那么當(dāng)我們遇到網(wǎng)頁圖片為相對(duì)鏈接的時(shí)候,我們?cè)撛趺刺幚砟??其?shí)很簡(jiǎn)單,我們只需要將循環(huán)那部分改為
那么我們就可以同樣在瀏覽器中輸出圖片了;
到此這篇關(guān)于PHP實(shí)現(xiàn)爬蟲爬取圖片代碼實(shí)例的文章就介紹到這了,更多相關(guān)PHP實(shí)現(xiàn)爬蟲內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
標(biāo)簽:唐山 鷹潭 柳州 鶴崗 遼陽 克拉瑪依 白城 六安
巨人網(wǎng)絡(luò)通訊聲明:本文標(biāo)題《PHP實(shí)現(xiàn)爬蟲爬取圖片代碼實(shí)例》,本文關(guān)鍵詞 PHP,實(shí)現(xiàn),爬蟲,爬取,圖片,;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題,煩請(qǐng)?zhí)峁┫嚓P(guān)信息告之我們,我們將及時(shí)溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無關(guān)。