今日R语言积累今天帮别人写个爬虫,爬cnn的文章内容以及包括作者。尝试了很多方法,从只是单纯的静态爬取到使用Rsenlenium爬取,再到phantomjs。中间也遇到很多问题。最后还是再phantomjs的帮助下解决了。这个中间遇到很多坑,比如在打开cnn网页的时候,使用rvest根本不行,什么内容都下载不了。 使用Rsenlenium的时候,cnn网页有时候会跳出填写邮箱、有时候会跳出接受co