国家开放大学2023秋《Python程序设计#-实验学院》形考任务六实验报告提交6参考答案

2023年12月2610:07:05发布者:江开学习小虫 105 views 举报
总字数:约870字
第1页
1/4页

第2页
2/4页

实验名称:实验 6 互联网评论数据分析及展现综合案例析

考核目的

1.了解词云的制作过程和方法。

2.熟悉过程中用到的 pandas 操作方法。

考核内容

本实验需要对电影评论数据进行分析,这是一类文本型数据,与之前见到的数值型数据 有很大区别。中文分词是中文文

本处理的一个基础步骤,也是中文人机自然语言交互的基础 模块,在进行中文自然语言处理时,通常需要先进行分词。

本文选择使用 Python 中的 jieba 模块进行分词,然后导入停用词表,去除停用词(停用词及语句中无意义的词,

如"的","了" 等)。本实验在接下来的步骤中进行了词频统计,然后利用词云这一直接的方式进行了展现。

考核要求

1.准备格式化数据。

2.通过案例掌握 Pandas 进行文本数据处理以及词云的可视化展现方法。

实验报告要求

1.实验报告由实验目标、实验环境、实验内容、实验结果、实验体会五个方面构成。实验结果为实现代码和生成的页面

截图。

2.实验报告以平台允许的格式上传。

3.实验报告由辅导教师评阅。

Python 程序设计课程实验报告

教师评语

教师签字

日期:

学生姓名

学号

一、实验目标

1.了解词云的制作过程和方法。

2.熟悉过程中用到的 pandas 操作方法

二、实验环境

Jupyter Notebook、Python3

三、实验内容

本实验需要对电影评论数据进行分析,这是一类文本型数据,

与之前见到的数值型数据 有很大区别。中文分词是中文文本处理的

一个基础步骤,也是中文人机自然语言交互的基础 模块,在进行中

文自然语言处理时,通常需要先进行分词。本文选择使用 Python

中的 jieba 模块进行分词,然后导入停用词表,去除停用词(停用

词及语句中无意义的词,如"的","了" 等)。本实验在接下来的步

骤中进行了词频统计,然后利用词云这一直接的方式进行了展现。

四、实验成果

国家开放大学2023秋《Python程序设计#-实验学院》形考任务六实验报告提交6参考答案

总页数:4
提示:下载前请核对题目。客服微信:diandahome
下载的文档都包含参考答案
特别声明:以上内容(如有图片或文件亦包括在内)为“电大之家”用户上传并发布,仅代表该用户观点,本平台仅提供信息发布。