关于gensim库中lda主题模型困惑度和一致性python图像绘制

相关文章推荐

苦闷的木瓜 · python ...· 2 周前 ·

风流的火柴 · 还不如GAN！谷歌、DeepMind等发文： ...· 1 年前 ·

强健的苦瓜 · 用魔法打败魔法！这件毛衣让摄像头看不到你；两 ...· 1 年前 ·

含蓄的蚂蚁 · 怎么使用可视化数据库工具 DBeaver ...· 1 年前 ·

粗眉毛的作业本 · 来不及细说，毕业半个月靠Python兼职赚了 ...· 1 年前 ·

耍酷的跑步机 · java去掉json两边的双引号 java ...· 1 年前 ·

dictionary = corpora.Dictionary(texts) corpus = [dictionary.doc2bow(text) for text in texts] def lda_model_values ( num_topics, corpus, dictionary ): x = [] # x轴 perplexity_values = [] # 困惑度 coherence_values = [] # 一致性 model_list = [] # 存储对应主题数量下的lda模型,便于生成可视化网页 for topic in range (num_topics): print ( "主题数量：" , topic+ 1 ) lda_model = models.LdaModel(corpus=corpus, num_topics=topic+ 1 , id2word =dictionary, chunksize = 2000 , passes= 20 , iterations = 400 ) model_list.append(lda_model) x.append(topic+ 1 ) perplexity_values.append(lda_model.log_perplexity(corpus)) coherencemodel = models.CoherenceModel(model=lda_model, texts=texts, dictionary=dictionary, coherence= 'c_v' ) coherence_values.append(coherencemodel.get_coherence()) print ( "该主题评价完成\n" ) return model_list, x, perplexity_values, coherence_values

import matplotlib.pyplot as plt
import matplotlib
from pylab import xticks,yticks,np
# 调用准备函数
model_list, x, perplexity_values, coherence_values = lda_model_values(num_topics, corpus, dictionary) 
# 绘制困惑度和一致性折线图
fig = plt.figure(figsize=(15,5))
plt.rcParams['font.sans-serif']=['SimHei']
matplotlib.rcParams['axes.unicode_minus'] = False 
ax1 = fig.add_subplot(1, 2, 1)
plt.plot(x, perplexity_values, marker="o")
plt.title("主题建模-困惑度")
plt.xlabel('主题数目')
plt.ylabel('困惑度大小')
xticks(np.linspace(1, num_topics, num_topics, endpoint=True)) # 保证x轴刻度为1
ax2 = fig.add_subplot(1, 2, 2)
plt.plot(x, coherence_values, marker="o")
plt.title("主题建模-一致性")
plt.xlabel("主题数目")
plt.ylabel("一致性大小")
xticks(np.linspace(1, num_topics, num_topics, endpoint=True))
plt.show()
根据困惑度和一致性进行主题数量的选择
基本选择：困惑度越低越好，一致性越高越好
  分类：




    
 人工智能
 
  
   相关推荐
   
        Exploring
        Python
      
     Python 爬虫快速入门
 最近在工作中有需要使用到爬虫的地方，需要根据 Gitlab + Python 实现一套定时爬取数据的工具，针对 Python 爬虫方面的知识进行了学习，也算 Python 入门了吧。
  275
 
 
        天天不吃饭啊
        Python
      
     揭秘PC端爬虫工程师必备的网络请求技巧，让你轻松采集所需数据
 网络请求是爬虫工程师采集数据的重要手段之一。在PC端爬虫中，网络请求通常使用HTTP协议进行通信，通过发送HTTP请求获取目标网站的数据。 爬虫工程师需要掌握HTTP协议的基本知识，包括HTTP请求和
  287
 
 
        DolphinDB
        Python
      
     Python + HDF5 因子计算与 DolphinDB 一体化因子计算方案对比
 Python vs DolphinDB，实打实的对比测试报告来了！点击看如何基于 Python + HDF5 和 DolphinDB 实现因子计算，以及两者计算性能对比~
  258
 
 
        Python
      
     【K哥爬虫普法】一个人、一年半、挣了2000万！
 ![01](https://p3-juejin.byteimg.com/tos-cn-i-k3u1fbpfcp/382621f324674ef6ba5f33e75ebabd6e~tplv-k3u1f
  291
 




    
 
        腾讯云开发者
        Python
      
     学习中心上新丨Python教程-Django框架快速入门到实战
 腾讯云×千锋教育强强联手，一同研发重磅推出全新课程《千锋图片云存储》Python 教程-Django 框架从入门到实战-基于腾讯云 COS Django框架实战教程发布
  372
 
 
        中亿丰数字科技集团有限公司
        Python
      
     利用Python和PostgreSQL实现BIM中的数据管理
 一、场景 BIM（建筑信息模型）是一种数字化的建筑设计和管理方法，它将建筑物的所有信息都存储在一个虚拟的模型中，包括结构、机电、管道、设备等各种信息。这些信息在建筑物的整个生命周期中都可以被访问和更新
  186
 
 
      
 11小时前
 
        Python
        SQLite
      
     PyQt操作SQLite
 在Python中，我们可以使用PyQt库来操作SQLite数据库。SQLite是一款非常轻量级的关系型数据库，它的数据库文件可以简单地存储在磁盘上。
  218
 
 
      
 13小时前
 
        Python
      
     果蔬识别系统Python+Django+TensorFlow+卷积神经网络算法
 ## 一、介绍 果蔬识别系统，使用Python作为主要开发语言，基于深度学习TensorFlow框架，搭建卷积神经网络算法。并通过对数据集进行训练，最后得到一个识别精度较高的模型。并基于Djang
  220
 




    
 
      
 12小时前
 
        Python
      
     Spider理论系列--协程（一）
 一、协程 概念 协程 又称微线程(纤程)，是一种用户态的轻量级线程 子程序 在所有的语言中都是层级调用的，比如A中调用B，B在执行过程中调用C，C执行完返回，B执行完返回，最后是A执行完毕。这是通过栈
  191
 
 
      
 14小时前
 
        Python
      
     Python 操作 Word 文件
 要操作 Word 文件，我们需要使用一个 Python 的第三方库叫做 python-docx。它可以让我们使用 Python 对 Word 文件进行读取、修改以及创建等操作。
  141
 
 
        Starrism
        Python
      
     pandas用法整理
 处理表格数据的时候经常用到pandas，每次用的时候都要去查函数，每次记不住，每次都查，哈哈哈，自己整理一下，码住。 一、Pandas的数据类型 进行数据分析时，如何正确使用数据类型，这非常重要。在p
  191
 
 
        Python
        MySQL
      
     Python基础教程:整合MySQL数据库
 Python数据库编程可以使用多种模块与API，例如SQLite、MySQL、PostgreSQL等。本教程将重点介绍使用Python连接MySQL数据库进行编程。
  563
 
 
        刘悦的技术博客
        Python
      
     南洋才女,德艺双馨,孙燕姿本尊回应AI孙燕姿(基于Sadtalker/Python3.10)
 孙燕姿果然不愧是孙燕姿，不愧为南洋理工大学的高材生，近日她在个人官方媒体博客上写了一篇英文版的长文，正式回应现在满城风雨的“AI孙燕姿”现象，流行天后展示了超人一等的智识水平，行文优美，绵恒隽永
  753
 
 
        Python
      
     服务:使用django构建:创建blog应用
 扩展api功能 -blog api， 新建posts 应用 在全局setting注册 在全局路由 注册 posts路由 App配置， 模型 models.py, 5个字段 App配置，在默认管理
  923
 
 
        CeshirenTester
        Python
      
     软件测试|教你如何离线安装第三方库
 前言 在日常工作生活中，我们有时需要在无法联网的设备中安装Python第三方库，在联网的情况下，我们安装第三方库只需要一条pip命令即可，运行命令之后，会自动开始下载；当我们在无法联网的情况下，我们就
  158
 
 
    WUNNAN