大众信息网

如何把网站上的文字采集成txt文本文档

关注:77  答案:2  手机版
解决时间 2021-01-16 13:30
如何把网站上的文字采集成txt文本文档
我说的是批量.有很多网页的文字需要采集.能够保存到本地TXT文本文档.有没有这样的软件或者方法?
最佳答案
呵呵,建议你用ASP做一个,或者VB等语言。
使用xmlhttp对象读取到整个网页的HTML代码,然后用一个正则表达式去除所有的html标记,得到纯文本,再保存到文本文件里。

我有做这样的ASP采集程序。要做这样的小软件也很快的。

当然,你还可以用纯文件浏览器,有些浏览器打开网页只显示文本的。用它打开网页,再另存为本地文件即可。
全部回答
应该有,不过我是一章一章的复制 再看看别人怎么说的。
我要举报
如以上问答内容为低俗、色情、不良、暴力、侵权、涉及违法等信息,可以点下面链接进行举报!