## 请您Star/Please Star 如果你觉得此工具不错,请轻轻点击此页面右上角**Star**按钮增加项目曝光度,谢谢! If you think this tool is good, please gently click the **Star** button in the upper right corner at this page to increase the project exposure, thank you! # EasySpider: Visual Code-Free Web Crawler 一个可视化爬虫软件,可以使用图形化界面,无代码可视化的设计和执行爬虫任务。只需要在网页上选择自己想要爬的内容并根据提示框操作即可完成爬虫设计和执行。同时软件还可以单独以命令行的方式进行执行,从而可以很方便的嵌入到其他系统中。 A visual code-free/no-code web crawler/spider, just select the content you want to crawl on the web page and operate according to the prompt box to complete the design and execution of the crawler. At the same time, the software can be executed by command line alone, so it can be easily embedded into other systems. ![animation_zh](media/animation_zh.gif) ![animation_en](media/animation_en.gif) ## 下载 EasySpider/Download EasySpider 进入 [Releases Page](https://github.com/NaiboWang/EasySpider/releases) 下载最新版本。如果下载速度慢,可以考虑从以下页面进入中国境内下载地址:[中国境内下载地址](https://github.com/NaiboWang/EasySpider/releases/download/v0.2.0/Download_Link_Address_in_China_Mainland.txt) 加QQ群从群文件下载也是一种方式,但使用软件的过程中发生了问题求助还是请从github提issue,因为群主不怎么看群,群号:**682921940**。 Refer to the [Releases Page](https://github.com/NaiboWang/EasySpider/releases) to download the latest version of EasySpider. ## 视频教程/Video Tutorials Bilibili/B站视频教程: [EasySpider介绍:中国地震台网采集案例](https://www.bilibili.com/video/BV1Fk4y1L7xX/) [如何无代码可视化的爬取需要登录才能爬的网站](https://www.bilibili.com/video/BV1HV4y1r7v8) [如何爬需要输入验证码的网站](https://www.bilibili.com/video/BV18c411K7FH) [如何切换IP池和使用隧道IP - 打开详情页采集案](https://www.bilibili.com/video/BV1KT411t79n) [流程图执行逻辑解析 - 58同城房源描述采集案例](https://www.bilibili.com/video/BV1YL411z7uW) [MacOS系统设计和执行eBay网站爬虫任务教程](https://www.bilibili.com/video/BV1WL411h71r) Refer to [Youtube Playlist](https://youtube.com/playlist?list=PL0kEFEkWrT7mt9MUlEBV2DTo1QsaanUTp) to see the video tutorials of EasySpider. ## 文档/Documentation 请点此进入[教程文档](https://github.com/NaiboWang/EasySpider/wiki),如有英文可暂时翻译一下,或看作者的[硕士毕业论文](Docs/%E9%9D%A2%E5%90%91WEB%E5%BA%94%E7%94%A8%E7%9A%84%E6%99%BA%E8%83%BD%E5%8C%96%E6%9C%8D%E5%8A%A1%E5%B0%81%E8%A3%85%E7%B3%BB%E7%BB%9F%E8%AE%BE%E8%AE%A1%E4%B8%8E%E5%AE%9E%E7%8E%B0.pdf)(主要看第三章和第五章)。 Documentation can be found from [Github Wiki](https://github.com/NaiboWang/EasySpider/wiki). ## 出版物/Publications - This software has been accepted by The Web Conference (WWW) 2023: [EasySpider: A No-Code Visual System for Crawling the Web](https://dl.acm.org/doi/abs/10.1145/3543873.3587345), March 2023. - 中国国家知识产权局发明专利,[一种自定义提取流程的服务封装系统](media/patent.png), 2022年5月。 - [浙江大学硕士论文](https://d.wanfangdata.com.cn/thesis/Y3691829),[面向WEB应用的智能化服务封装系统设计与实现](Docs/%E9%9D%A2%E5%90%91WEB%E5%BA%94%E7%94%A8%E7%9A%84%E6%99%BA%E8%83%BD%E5%8C%96%E6%9C%8D%E5%8A%A1%E5%B0%81%E8%A3%85%E7%B3%BB%E7%BB%9F%E8%AE%BE%E8%AE%A1%E4%B8%8E%E5%AE%9E%E7%8E%B0.pdf),2020年6月。 ## 中文界面截图 #### 软件界面示例 ![pic](media/Picture.png) #### 块和子块及表单定义 ![pic](media/Picture2.png) #### 已选中和待选择示例 ![pic](media/Picture7.png) #### 京东商品块选择示例: ![pic](media/Picture1.png) #### 京东商品标题自动匹配选择示例 ![pic](media/Picture5.png) #### 分块选择所有子元素示例 ![pic](media/Picture6.png) #### 同类型元素自动和手动匹配示例 ![pic](media/Picture8.png) #### 四种选择方式示例 ![pic](media/Picture90.png) #### 输入文字示例 ![pic](media/Picture10.png) #### 循环点击58同城房屋标题以进入详情页采集示例 ![pic](media/Picture12.png) #### 采集元素文本示例 ![pic](media/Picture14.png) #### 流程图界面介绍 ![pic](media/Picture4.png) #### 循环选项示例 ![pic](media/Picture9.png) #### 循环点击下一页示例 ![pic](media/Picture11.png) #### 条件分支示例 ![pic](media/Picture13.png) #### 完整采集流程图示例 ![pic](media/Picture16.png) #### 完整采集流程图转换为常规流程图示例 ![pic](media/Picture91.png) #### 服务信息示例 ![pic](media/Picture15.png) #### 服务调用示例 ![pic](media/Picture17.png) #### 58 同城房源信息采集服务部分采集结果展示 ![pic](media/Picture18.png)