Python 数据操作教程在 PYTHON 中创建虚拟数据
25页1、Pandas 是 Python 中最受欢迎的软件包之一,广泛用于数据操作。它是一个非常强大且用途广泛的软件包,使数据清理和整理变得更加轻松愉快。Pandas 库对 Python 社区做出了巨大贡献,它使 Python 成为数据科学和分析领域的顶级编程语言之一。它已成为数据分析师和科学家进行数据分析和操作的首选。什么是熊猫包?Pandas 包具有许多功能,这些功能是数据处理和操作的本质。简而言之,它可以为您执行以下任务1. 创建类似于 R 的数据框和 Excel 电子表格的结构化数据集。2. 从 CSV、TXT、XLSX、SQL 数据库、R 等各种来源读取数据。3. 从数据集中选择特定的行或列4. 按升序或降序排列数据5. 根据某些条件过滤数据6. 按分类变量汇总数据7. 将数据重塑为宽格式或长格式8. 时间序列分析9. 合并和连接两个数据集10. 遍历数据集的行11. 以 CSV 或 Excel 格式写入或导出数据数据集:在本教程中,我们将使用两个数据集:income和iris。1. income data: 该数据包含各米国各州从2002年到2015年的收入。该数据集包含51个观测值
2、和16个变量。下载链接2. iris 数据:它包含 150 个观测值和 5 个变量。我们有 3 种花(每种 50 朵花),所有花的萼片长度和宽度以及花瓣长度和宽度都已给出。下载链接要记住的重要熊猫功能以下是常见任务以及 pandas 函数的列表。公用事业功能提取列名称df.列选择前 2 行df.iloc:2选择前 2 列df.iloc:,:2按名称选择列df.loc:,col1,col2选择随机编号行数df.样本(n = 10)选择随机行的分数df.sample(frac = 0.2)重命名变量df.重命名()选择一列作为索引df.set_index()删除行或列df.drop()排序值df.sort_values()分组变量df.groupby( )过滤df.查询()查找缺失值df.isnull( )删除缺失值df.dropna( )删除重复项df.drop_duplicates()创建假人pd.get_dummies( )排行df.rank( )累计金额df.cumsum( )分位数df.分位数()选择数值变量df.select_dtypes()连接两个数据帧pd.concat()
3、基于公共变量合并pd.合并()导入熊猫库您需要先导入或加载 Pandas 库才能使用它。“Importing a library”就是把它加载到内存中,然后你就可以使用它了。运行以下代码导入 pandas 库:import pandas as pd“pd”是别名或缩写,将用作访问或调用 pandas 函数的快捷方式。要访问 pandas 库中的函数,您只需在每次需要应用时键入pd.function而不是pandas.function 。导入数据集要从 CSV 文件读取或导入数据,可以使用read_csv() 函数。在该函数中,您需要指定 CSV 文件的文件位置。income = pd.read_csv(C:UsersHpPythonBasicsincome.csv) Index State Y2002 Y2003 Y2004 Y2005 Y2006 Y2007 0 A Alabama 1296530 1317711 1118631 1492583 1107408 1440134 1 A Alaska 1170302 1960378 1818085 1447852 1861639 146
4、5841 2 A Arizona 1742027 1968140 1377583 1782199 1102568 1109382 3 A Arkansas 1485531 1994927 1119299 1947979 1669191 1801213 4 C California 1685349 1675807 1889570 1480280 1735069 1812546 Y2008 Y2009 Y2010 Y2011 Y2012 Y2013 Y2014 Y2015 0 1945229 1944173 1237582 1440756 1186741 1852841 1558906 1916661 1 1551826 1436541 1629616 1230866 1512804 1985302 1580394 1979143 2 1752886 1554330 1300521 1130709 1907284 1363279 1525866 1647724 3 1188104 1628980 1669295 1928238 1216675 1591896 1360959 1329341
《Python 数据操作教程在 PYTHON 中创建虚拟数据》由会员云***分享,可在线阅读,更多相关《Python 数据操作教程在 PYTHON 中创建虚拟数据》请在金锄头文库上搜索。
2023-09-09 59页
2023-08-28 1页
2023-08-27 18页
2023-08-27 7页
2023-08-27 6页
2023-08-27 6页
2023-08-27 8页
2023-08-23 6页
2023-08-23 3页
2023-08-23 20页