This website requires JavaScript.
Explore
Help
Sign In
spider
/
js_reverse
Watch
1
Star
0
Fork
0
You've already forked js_reverse
mirror of
https://github.com/luzhisheng/js_reverse.git
synced
2025-04-12 11:37:09 +08:00
Code
Issues
Packages
Projects
Releases
Wiki
Activity
js_reverse
/
gooood
/
README.md
luzhisheng
a9ac2cf223
gooood
2023-05-11 11:07:46 +08:00
440 B
Raw
Permalink
Blame
History
Unescape
Escape
案例
此网站爬虫部分简单
,
清洗逻辑繁琐一点正文内容以后台生成html展示。
项目结构
docs是存储结果目录
spider是爬虫文件目录
extrator是解析文件目录
解析结构
几个问题点
这只是个简单案例,此项目没有测试用例,无法保证代码长期正常运行
项目信息2逻辑比较琐碎
,
时间有限
,
暂不处理