提示信息

Python读取CSV文件的多种方法

西贡 已关注

读取CSV文件是Python中常见的操作,以下是几种常用的方法来处理CSV文件:

1. 使用内置的 csv 模块

  1. import csv
  2. # 读取CSV文件
  3. with open('file.csv', newline='', encoding='utf-8') as csvfile:
  4. csvreader = csv.reader(csvfile)
  5. for row in csvreader:
  6. print(row)
  • DictReader: 将每一行数据解析成一个字典,字典的键是CSV文件的头部(第一行内容)。
  1. import csv
  2. with open('file.csv', newline='', encoding='utf-8') as csvfile:
  3. csvreader = csv.DictReader(csvfile)
  4. for row in csvreader:
  5. print(row) # 输出一个字典,每列名为键

2. 使用 pandas

pandas 是一个强大的数据处理和分析工具,它提供了更加灵活的CSV读取功能。

  1. import pandas as pd
  2. # 读取CSV文件到DataFrame
  3. df = pd.read_csv('file.csv')
  4. print(df.head()) # 打印前五行
  • 参数: pandas.read_csv() 提供了许多参数,如设定分隔符 sep,选择列 usecols,处理缺失值 na_values 等。
  1. df = pd.read_csv('file.csv', sep=';', usecols=['Column1', 'Column2'], na_values=['NA', 'N/A'])

3. 使用 numpy

适合简单的数值数据,可以快速读取到数组中。

  1. import numpy as np
  2. # 使用genfromtxt读取CSV
  3. data = np.genfromtxt('file.csv', delimiter=',', dtype=None, encoding='utf-8')
  4. print(data)

4. 使用 openpyxlxlrd 等读取Excel再转换为CSV

虽然openpyxlxlrd主要用于Excel文件,但有时需要读取Excel文件内容并转换为CSV,有必要了解。

5. 使用 dask

对大文件进行操作时的一种选择,可以进行部分加载。

  1. import dask.dataframe as dd
  2. # 读取CSV文件
  3. df = dd.read_csv('file.csv')
  4. print(df.head())

不同的方法有不同的优缺点,选择合适的工具和方法可以提高工作效率,尤其是在处理大规模数据或复杂文件时。

    遇到难题? "AI大模型GPT4.0、GPT" 是你的私人解答专家! 点击按钮去提问......
西贡 关注 已关注

最近一次登录:2024-11-20 11:30:48   

暂时还没有签名,请关注我或评论我的文章
×
免费图表工具,画流程图、架构图