2020年11月5日,建桥学院博士论坛第70期在商学院8323室顺利举行。主讲人朱逸博士后以“告别编程——网络文本数据的爬取与分析技术”为主题,从①拆解已发表的相关研究文章,探讨网络文本研究的常规模式;②网络文本数据的采集来源及适用性;③常用的数据爬取、分析软件,梳理文本分析流程三个方面进行了分享,并向参会教师重点介绍了“后羿采集器”、“秩数”、“火车头采集器”、“八爪鱼大数据”、“贝壳采集器”等多款数据爬取与分析软件,帮助老师们进行大数据的高效采集和利用。
互联网中充斥着大量的文本数据信息,例如新闻、文章、评论、点赞、转发等诸多形式,这些数据有着重要的分析价值。诸多前沿研究都开始专注于对此类数据的采集与分析,成为了大数据在社会科学领域的重要运用,逐渐成为一类混合性研究的趋势。但挡在诸多研究者面前的是对于计算机技术的掌握,诸多复杂的编程语言成为了一道无形的墙。朱逸博士后在此次博士论坛中的分享能够帮助老师无需编程而实现对网络文本数据的爬取与分析,得到参会老师的认可,有助于我校教师数据分析和运用水平的整体提升。
供稿:王鹏