浏览代码

爬虫启动文件

dongzhaorui 3 年之前
父节点
当前提交
357872af33
共有 1 个文件被更改,包括 17 次插入0 次删除
  1. 17 0
      find_source/build_spider.py

+ 17 - 0
find_source/build_spider.py

@@ -0,0 +1,17 @@
+
+from crawler import BreadthCrawler
+from crawler.search_engine import BingSearchEngine
+
+
+def main():
+    engines = [
+        BingSearchEngine()
+    ]
+    BreadthCrawler(
+        allow_load_filter=False,
+        workers=2,
+    ).set_search_engines(engines).start()
+
+
+if __name__ == '__main__':
+    main()