爬取证券之星数据
一、实验目的
掌握使用 urllib 库访问目标网址, BeautifulSoup 库解析网页,获得网页静态加载的数据信息
的方法。
二、实验内容
创建一个爬虫项目 StockStar ,用于爬取证券之星的部分信息,主要包括代码、简称、流通
市 值 ( 万 元 ) 、 总 市 值 ( 万 元 ) 、 流 通 股 本 ( 万 元 ) 、 总 股 本 ( 万 元 ) , 其 网 址 为 : http://
quote.stockstar.com/stock/ranklist_a.shtml ,具体要求如下:
1. 使用 urllib 库、 requests 库访问网站,使用 bs4 库、 lxml 库解析网页。
2. 获取数据后,用 NumPy 库、 Pandas 库将其格式化为 DataFrame
3. 用 Python3 自带的 sqlite3 库,将数据本地存储在数据库中。
4. 从数据库中读取数据并创建为 DataFrame ,再打印数据作为展示。
三、作业提交要求
完成实验报告(见附件模板),将源代码和实验报告一起压缩打包提交至学习平台。
答案是:
江苏开放大学实验报告
学 号:
姓 名:
课程代码: 060749
课程名称:
数据采集与预处理
评阅教师:
第
1
次任务(书面作业)
共
5
次任务(书面作业)