使用Python构建科学家合作社会网络_学术合作网络研究python_ZCJY的博客

相关文章推荐
大力的牛肉面 · 解决 Rust 中的 ...· 昨天 ·
幸福的领带 · RxJava2 实战知识梳理(9) - ...· 1 年前 ·
气势凌人的茶叶 · 无法使用JNDI连接到Websphere ...· 1 年前 ·
温暖的饭卡 · ggplot2（6）标度、坐标轴和图例 ...· 1 年前 ·
威武的海龟 · WinForm控件之【CheckBox】 ...· 2 年前 ·
年轻有为的签字笔 · Java 随机数生成器 Random & ...· 2 年前 ·
本文拟构建一个科研人员共同完成一篇论文的合作社会网络。
实验步骤如下：
提取每篇论文中作者
去除非法字符
构建图的结点和权重（合作论文的篇数，其中两个结点相同是表示该作者总共发表的论文数量）
保存文件
将文件处理成Gephi可识别的格式
import csv
import pandas as pd
row_count = 0
authors_set = set()
# 合作关系与权重（合作的次数）
authors_graph = {}
with open(r'./data/author.csv', 'r') as f:
    authors_reader = csv.reader(f)
    for row in authors_reader:
        row_count += 1
        print(f'读取到第：{row_count}行')
        authors_row = []
        for author in row:
            if len(author) == 0:
                continue
            # 去除空字符串和前后空格
            author = author.strip()
            authors_row.append(author)
        authors_row_num = len(authors_row)
        for i in range(authors_row_num):
            for j in range(i, authors_row_num):
                # 因为是无向图所以只记录了一个
                if f'{authors_row[i]}, {authors_row[j]}' in authors_graph.keys():
                    authors_graph[f'{authors_row[i]}, {authors_row[j]}'] += 1
                elif f'{authors_row[i]}, {authors_row[j]}' in authors_graph.keys():
                    authors_graph[f'{authors_row[i]}, {authors_row[j]}'] += 1
                else:
                    authors_graph[f'{authors_row[i]}, {authors_row[j]}'] = 1
    # 将结果写入excel
key = list(authors_graph.keys())
value = list(authors_graph.values())
result_excel = pd.DataFrame()
result_excel["结点"] = key
result_excel["权重"] = value
writer = pd.ExcelWriter(r'./data/author_graph.xlsx', mode="w+")
result_excel.to_excel(writer, index=False)
writer.save()
print('success!!!')
保存的数据
 

 存在的问题： 
数据量太庞大（相当于Gephi），约21万条数据，Gephi处理有点慢。（希望同志们多多努力！）
如果需要数据私聊！免费给！！
                    本文拟构建一个科研人员共同完成一篇论文的合作社会网络。实验步骤如下：提取每篇论文中作者去除非法字符构建图的结点和权重（合作论文的篇数，其中两个结点相同是表示该作者总共发表的论文数量）保存文件将文件处理成Gephi可识别的格式import csvimport pandas as pdrow_count = 0authors_set = set()# 合作关系与权重（合作的次数）authors_graph = {}with open(r'./data/author.csv', '
				Databolt Flow对于数据科学家和数据工程师而言，d6tflow是一个python库，使构建复杂的数据科学工作流变得容易，快速和直观。
它建立在工作流管理器luigi之上，但是与luigi不同，它是o Databolt Flow对于数据科学家和数据工程师而言，d6tflow是一个python库，可简化，快速且直观地构建复杂的数据科学工作流。
它基于工作流管理器luigi构建，但与luigi不同，它针对数据科学工作流进行了优化。
为什么要使用d6tflow？
数据科学工作流通常看起来像这样。
工作流涉及将参数化的任务链接在一起，这些任务在彼此之间传递多个输入和输出。
输出数据存储在多个dataf中
				 课程名称: Python数据科学 英文名称：Python Data Sience 学时学分: 57课时，3学分 适用专业: 数据科学相关专业 课程简介: Python编程语言本身简洁，优美,跨平台，功能超级强大，是人工智能时代最流行的编程 语言，也是美国主流大学最受欢迎入门编程语言。美计算机科学系Top10中有8家Top39中 24家，在编程入门课程中教授Python。三家最大的 MOOC网络课程服务商edX、Coursera和Udacity也全都提供了Python入门编程语言。 《Python数据科学》课程以实践应用任务为导向，全面实践数据分析、数据挖掘与文本挖 掘的流程与python数据分析库、数据挖掘库、文本挖掘功能的应用。内容涵盖python编 程基础、python数据科学生态系统的numpy数值计算、pandas数据预处理与数据分析、m atplotlib数据可视化、使用scikit- learn构建基本数据挖掘模型、python中文文本处理（分词、词频统计、词云）、文本情 感分析、主题模型等。有条件的单位，可以介绍深度学习的入门知识，并基于pytorch进 行实践。 教学
				我们已经到达了本文最受期待的部分-构建模型！这就是我们大多数人首先进入数据科学领域的原因，不是吗？让我们通过这三个Python库探索模型构建。就像用于数据操作的Pandas和用于可视化的matplotlib一样，scikit-learn是构建模型的Python库领导者。没有什么比得上它了。事实上，scikit-learn建立在NumPy，SciPy和matplotlib之上。它是开源的，每个人都可以访问，并且可以在各种环境中重用。以下是安装scikit-learn的代码：Scikit-learn支持在机器学习中执行的不同操作，如分类，回归，聚类，模型选择等。我还建议您浏览以下链接以了解有关sc
				我是Python语言的忠实粉丝，它是我在数据科学方面学到的第一门编程语言。Python有三个特点：它的易用性和灵活性全行业的接受度：它是业内最流行的数据科学语言用于数据科学的庞大数量的Python库事实上，有如此多的Python库，要跟上它们的发展速度可能会变得非常困难。这就是为什么我决定消除这种痛苦，并编辑这24个Python库。换句话说，在数据科学领域，你掌握这个24个python库就够了！那是对的-我根据各自在数据科学中的角色对这些库进行了分类。所以我提到了用于数据清理，数据操作，可视化，构建模型甚至模型部署（以及其他）的库。这是一个非常全面的列表，可帮助您开始使用Python进行数据科
				1 社会网络分析经典文献
1.1 《Network Analysis in the Social Science》
这篇文章于2009年发表在《Science》，详细了地介绍了如何利用社会网络解决实际问题。
1.2《.一国农产品贸易网络特征及其对全球价值链分工的影响——基于社会网络分析视角》1
该文对农产品贸易网络特征及其全球价值链冯影响进行了分析。社会网络分析很适合分析关系型数据。
[1]马述忠,任婉婉,吴国杰.一国农产品贸易网络特征及其对全球价值链分工的影响——基于社会网络分析视角[J].管理世界,2
				### 回答1：
《Python数据科学手册》是一本针对数据科学领域的权威教程，以Python编程语言为基础，介绍了数据处理和分析的理论与实践。该书由美国加州大学伯克利分校的Jake VanderPlas撰写，涵盖了大量的主题，从数据清洗、数据可视化到机器学习和深度学习等。它适合想要学习和掌握数据科学技术的初学者和从业人员。
《Python数据科学手册》的英文版在全球范围内广受欢迎，因为它以清晰、简洁和易于理解的方式解释了各种数据科学术语和技术。书中的内容结构合理，通俗易懂，使读者能够逐步构建对数据科学的全面理解。
这本手册通过几个主要部分来介绍数据科学的方方面面。首先，它讨论了Python的基础知识和数据处理库（例如NumPy和Pandas），并提供了示例代码和实践练习，以帮助读者掌握这些核心概念。
然后，手册深入讲解了数据可视化的技术，包括Matplotlib和Seaborn等库的使用。它详细展示了如何用图表和可视化方法向数据中的模式和趋势发现。
另外，该书介绍了机器学习的基本概念和常用算法，包括回归、分类和聚类等。通过实际应用案例，读者能够理解并掌握这些方法的原理和实现。
最后，手册还简要介绍了深度学习的基础知识，包括人工神经网络和卷积神经网络等。读者可以了解到如何使用Python和相应的库（如TensorFlow和Keras）来构建和训练深度学习模型。
总的来说，《Python数据科学手册》英文版提供了一个全面而系统的学习资源，帮助读者快速入门数据科学，并为进一步探索提供了扎实的基础。无论是对于学术研究、商业分析还是个人项目，这本书都是值得推荐的。  
### 回答2：
《Python数据科学手册》是一本权威的教程，旨在帮助读者掌握Python在数据科学领域的应用。本书内容丰富，涵盖了数据处理、数据分析、机器学习和可视化等方面。
首先，本书详细介绍了Python在数据处理方面的工具和技术，如NumPy和Pandas库。NumPy提供了多维数组和矩阵的高效处理能力，Pandas则为数据分析提供了强大的数据结构和函数。通过阅读本书，读者将学习如何加载、清洗和转换数据，以及如何进行基本的统计分析和数据探索。
其次，本书还介绍了使用Python进行数据分析的技术和方法。例如，使用matplotlib和Seaborn库进行数据可视化，可以帮助人们更好地理解和展示数据。此外，书中还详细介绍了数据聚合、数据透视表、时间序列分析和数据库操作等常用的数据分析方法。
此外，本书还涵盖了机器学习的基础知识和常用算法。Python在机器学习方面有着广泛的应用，本书介绍了使用Python进行特征选择、模型评估和模型调优的方法。同时，本书还提供了实际案例和示例代码，帮助读者将理论应用到实际问题中。
总结起来，《Python数据科学手册》是一本非常全面和实用的书籍，对于希望使用Python进行数据科学工作的读者来说，是一本不可或缺的参考资料。无论是数据处理、数据分析还是机器学习，都能从本书中找到相关的工具、技术和案例。通过阅读本书，读者可以系统地学习和掌握Python在数据科学领域的应用。  
### 回答3：
《Python数据科学手册》是一本讲解如何使用Python进行数据科学的英文版书籍。该书涵盖了数据科学的各个领域，包括数据分析、数据可视化、机器学习等内容。这本书的作者是Jake VanderPlas，他是一位资深的数据科学家和编程专家。
《Python数据科学手册》由16个章节组成。第一章介绍了数据科学的概述和基本概念。接下来的几章详细介绍了使用Python进行数据处理和数据分析的基本工具和技术，包括NumPy、Pandas、Matplotlib等。这些章节不仅介绍了这些工具的基本用法，还提供了一些实际的案例供读者学习。
接下来的几章重点介绍了数据可视化和统计分析的相关内容。作者详细讲解了如何使用Matplotlib和Seaborn等工具创建各种类型的数据可视化图表，并介绍了一些基本的统计分析方法和技巧。
在《Python数据科学手册》的后几章，作者介绍了机器学习和数据挖掘的相关内容。他介绍了使用Scikit-Learn库进行机器学习的基本步骤和方法，并提供了一些实际的机器学习案例供读者参考。
总体而言，《Python数据科学手册》是一本非常全面和实用的数据科学学习指南。它以Python为基础，结合了大量的实例和案例，帮助读者系统地学习和应用数据科学的相关知识和技术。无论是初学者还是有一定经验的数据科学家，都可以从这本书中获得很多有价值的信息和指导。
                    [code=python]
[/code]AttributeError                            Traceback (most recent call last)
Input In [1], in Ui_MainWindow.getCompaniesAddress(self, tableWidget)
    360 time.sleep(1)
    361 # ['company', 'addressRaw', 'addressCrawl', 'score']
--> 362 Flag, addressCrawl = self.getAddress(name)
    363 # print(name, addressCrawl)
    364 # 更新表中的爬取地址和得分
    365 if Flag:
Input In [1], in Ui_MainWindow.getAddress(self, companyName)
    201 table = soup.find('table', attrs={'class': 'ntable ntable-list'})
    202 # print(table)
    203 # 找到公司名
--> 204 span1 = table.find('span', attrs={'class': 'copy-title'})
    205 span2 = span1.find('span')
    206 name = span2.text
AttributeError: 'NoneType' object has no attribute 'find'
An exception has occurred, use %tb to see the full traceback
                Pyqt5+爬虫实现函证地址核对
                    ZCJY: 
                    哪一行报错
                Pyqt5+爬虫实现函证地址核对
                    nn_nn5: 
                    请问下为什么跑的时候一直报错“AttributeError: 'NoneType' object has no attribute 'find”