關(guān)于Scrapy爬蟲項(xiàng)目運(yùn)行和調(diào)試的小技巧(上篇)
掃除運(yùn)行Scrapy爬蟲程序的bug之后,現(xiàn)在便可以開始進(jìn)行編寫爬蟲邏輯了。在正式開始爬蟲編寫之前,在這里介紹四種小技巧,可以方便我們操縱和調(diào)試爬蟲。
一、建立main.py文件,直接在Pycharm下進(jìn)行調(diào)試
很多時(shí)候我們?cè)谑褂肧crapy爬蟲框架的時(shí)候,如果想運(yùn)行Scrapy爬蟲項(xiàng)目的話,一般都會(huì)想著去命令行中直接執(zhí)行命令“scrapy crawl crawler_name”,其中crawler_name指的是爬蟲的名字,在一開始創(chuàng)建Scrapy爬蟲模板的時(shí)候就指定了的,而且在該爬蟲項(xiàng)目中具有唯一性。但是每次跑到命令行下去執(zhí)行,看交互的結(jié)果,有時(shí)候并不是很清晰,所以這里介紹一種方法,可以幫助大家提高開發(fā)效率,尤其是調(diào)試的時(shí)候更是顯得方便。
在與爬蟲項(xiàng)目的scrapy.cfg文件同級(jí)目錄下建立一個(gè)main.py文件,用于控制整個(gè)爬蟲項(xiàng)目的執(zhí)行。
在該文件夾中寫入的代碼見下圖。其中execute函數(shù)是內(nèi)嵌在scrapy中的,調(diào)用這個(gè)函數(shù)可以直接調(diào)用該Scrapy工程項(xiàng)目的爬蟲腳本,這個(gè)函數(shù)的執(zhí)行需要在爬蟲項(xiàng)目的父目錄下進(jìn)行。而第7行代碼的意思就是獲取當(dāng)前py文件的父目錄,省去我們直接復(fù)制路徑的精力和時(shí)間,同時(shí)也方便我們將該項(xiàng)目放到其他的平臺(tái)上去運(yùn)行,不會(huì)報(bào)路徑的錯(cuò)誤。execute函數(shù)里邊的參數(shù)其實(shí)就是將Scrapy爬蟲執(zhí)行命令拆分,然后分別以一個(gè)字符的方式放到了一個(gè)數(shù)組中。
之后我們直接運(yùn)行這個(gè)main.py文件便可以調(diào)用Scrapy爬蟲程序了。

發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
最新活動(dòng)更多
-
3月27日立即報(bào)名>> 【工程師系列】汽車電子技術(shù)在線大會(huì)
-
4月30日立即下載>> 【村田汽車】汽車E/E架構(gòu)革新中,新智能座艙挑戰(zhàn)的解決方案
-
5月15-17日立即預(yù)約>> 【線下巡回】2025年STM32峰會(huì)
-
即日-5.15立即報(bào)名>>> 【在線會(huì)議】安森美Hyperlux™ ID系列引領(lǐng)iToF技術(shù)革新
-
5月15日立即下載>> 【白皮書】精確和高效地表征3000V/20A功率器件應(yīng)用指南
-
5月16日立即參評(píng) >> 【評(píng)選啟動(dòng)】維科杯·OFweek 2025(第十屆)人工智能行業(yè)年度評(píng)選
推薦專題
- 1 UALink規(guī)范發(fā)布:挑戰(zhàn)英偉達(dá)AI統(tǒng)治的開始
- 2 北電數(shù)智主辦酒仙橋論壇,探索AI產(chǎn)業(yè)發(fā)展新路徑
- 3 降薪、加班、裁員三重暴擊,“AI四小龍”已折戟兩家
- 4 “AI寒武紀(jì)”爆發(fā)至今,五類新物種登上歷史舞臺(tái)
- 5 國(guó)產(chǎn)智駕迎戰(zhàn)特斯拉FSD,AI含量差幾何?
- 6 光計(jì)算迎來商業(yè)化突破,但落地仍需時(shí)間
- 7 東陽光:2024年扭虧、一季度凈利大增,液冷疊加具身智能打開成長(zhǎng)空間
- 8 地平線自動(dòng)駕駛方案解讀
- 9 封殺AI“照騙”,“淘寶們”終于不忍了?
- 10 優(yōu)必選:營(yíng)收大增主靠小件,虧損繼續(xù)又逢關(guān)稅,能否乘機(jī)器人東風(fēng)翻身?