利用R抓取web并解析
本文使用R中web解析包rvest
来抓取和解析web,rvest
借鉴了Pyhon
和Ruby
中web解析包Beautiful Soup
,
并支持%>%
语法,使程序非常简洁,可读性非常强。
加载R包
抓取web
本文以参考文献中实例为基础,改编而来。以抓取暴雪游戏中英雄属性为例,
抓取英雄的属性包括:名字,角色,攻击范围,HP,Mana,attack damage, attack speed
需要注意的是R
中使用正则表达式与Pyhotn
和Ruby
中略有不同,详细区别需查询帮助。
生成最终数据
可视化数据
参考文献:r got good at scraping