소스 검색

爬虫启动文件

dongzhaorui 3 년 전
부모
커밋
357872af33
1개의 변경된 파일17개의 추가작업 그리고 0개의 파일을 삭제
  1. 17 0
      find_source/build_spider.py

+ 17 - 0
find_source/build_spider.py

@@ -0,0 +1,17 @@
+
+from crawler import BreadthCrawler
+from crawler.search_engine import BingSearchEngine
+
+
+def main():
+    engines = [
+        BingSearchEngine()
+    ]
+    BreadthCrawler(
+        allow_load_filter=False,
+        workers=2,
+    ).set_search_engines(engines).start()
+
+
+if __name__ == '__main__':
+    main()