本项目利用 Python 的 scrapy 框架爬取 链家网 的上海市租房信息,利用 pandas 、 numpy 、 matplotlib 、 seaborn 、 folium 、 wordcloud 等库进行数据分析和可视化,通过 one-hot 编码和文本特征提取出120个训练特征,搭建3层神经网络对上海市租房价格进行预测。
本项目以电影数据为主题,以数据采集、处理、分析及数据可视化为项目流程,可实现百万级电影数据离线处理与计算。 项目 ...