Python [41]

Pycharm如何设置默认控制台输出

最近更新了一下软件,很多设置就变了,遇到了一个特别无语的问题,那就是在Pycharm中运行代码,不是在自带的控制台中输出,而是连接的python控制台输出,就会无限连,就有无数标签页,很恶心......

爬取美女图片保存本地与入MySQL库

本文详细记录如何爬取美女图片,并将图片下载保存在本地,同时将图片url进行入库。保存在本地肯定是为了没事能拿出来养养眼啊,那入库就是为了定位图片啊,要懂点技术的话,还能搬运搬运做个小图片网站,不为别的,就是养眼和学习!本文主要讲思路和方法,源码、数据库、图片文件获取方式见文末!

文档处理与查询设计

本部分是web挖掘课程的一个作业,大部分是基于python实现的,而且就是nlp相关的操作,所以记录在这里了。

分词工具集成

本部分记录如何利用Python进行分词工具集成,集成工具可以实现运行无环境要求,同时也更方便。

Python实现LDA模型

lda主题模型文档主题生成模型(Latent Dirichlet Allocation,简称LDA)通常由包含词、主题和文档三层结构组成。

正则表达式清洗文本数据

正则表达式正则表达式是一种文本模式,包括普通字符(例如,a 到 z 之间的字母)和特殊字符(称为元字符)。正则表达式使用单个字符串来描述、匹配一系列匹配某个句法规则的字符串。

Jieba分词

Jiebajieba 是一个中文分词第三方库,被称为最好的 Python 中文分词库。支持三种分词模式:精确模式、全模式和搜索引擎模式,并且支持繁体分词和自定义词典。

词频统计与TF-IDF

TF-IDF和词频是脱不了关系的,所以在这里再记录一下关于词频的内容。其实在词云图那块儿就已经完成了词频统计,这里记录另一种方法,即利用NLTK包实现统计与可视化。

Python实现简单GUI程序

Python有很多GUI库,如CSDN博主Python 学习者整理的13个库:http://t.csdn.cn/304jk最常用的有Tkinter、pyqt等,本文档主要记录基于pyqt5库的开发与学习PyQt5是Digia的一套Qt5应用框架与python的结合

词云图制作

python实现词云python实现词云的方式有很多种,例如wordcloud包、pyecharts包、stylecloud包,这里主要介绍两种办法:调用pyecharts包画图调用stylecloud包画图pyecharts包画词云图明白要输入什么数据和怎么调整配置就行