利用xlrd库高效读取Excel(.xls)文件数据的实用指南

xlrd 是一个用于读取旧版 Excel 文件(即 .xls 格式,Excel 97-2003 工作簿)的 Python 库。不过,需要注意的是,xlrd 从版本 2.0.0 开始已经不再支持 .xlsx 格式(Excel 2007 及更高版本的工作簿)。如果你需要读取 .xlsx 文件,可以考虑使用 openpyxl 或 pandas(后者内部使用了 openpyxl 或 xlrd 的旧版本以支持 .xls)。

图片[1]_利用xlrd库高效读取Excel(.xls)文件数据的实用指南_知途无界

以下是一个使用 xlrd 读取 .xls 文件的简单示例代码:

import xlrd

# 打开一个Excel文件
workbook = xlrd.open_workbook('example.xls')

# 通过索引获取工作表
sheet = workbook.sheet_by_index(0)  # 获取第一个工作表
# 或者通过名称获取工作表
# sheet = workbook.sheet_by_name('Sheet1')

# 读取工作表中的行数和列数
num_rows = sheet.nrows
num_cols = sheet.ncols

print(f"行数: {num_rows}, 列数: {num_cols}")

# 读取特定单元格的内容
cell_value = sheet.cell_value(rowx=0, colx=0)  # 读取第一行第一列的内容
print(f"第一行第一列的内容: {cell_value}")

# 遍历工作表中的所有行和列
for row_index in range(num_rows):
    for col_index in range(num_cols):
        cell_value = sheet.cell_value(rowx=row_index, colx=col_index)
        print(f"行 {row_index + 1}, 列 {col_index + 1} 的内容: {cell_value}")

在这个示例中,我们首先导入了 xlrd 库,然后打开了一个名为 example.xls 的 Excel 文件。接着,我们通过索引获取了第一个工作表,并读取了工作表中的行数和列数。然后,我们演示了如何读取特定单元格的内容,并遍历工作表中的所有单元格以打印它们的内容。

如果你正在处理 .xlsx 文件,并且希望使用类似的接口来读取数据,你可以考虑使用 pandas 库,它提供了更高级的数据处理功能,并且支持多种文件格式,包括 .xlsx。以下是一个使用 pandas 读取 .xlsx 文件的示例:

import pandas as pd

# 读取Excel文件
df = pd.read_excel('example.xlsx', sheet_name='Sheet1')  # 指定工作表名称
# 或者读取所有工作表
# excel_file = pd.ExcelFile('example.xlsx')
# df = pd.read_excel(excel_file, sheet_name=0)  # 通过索引读取第一个工作表

# 打印DataFrame的内容
print(df)

# 访问特定单元格的内容
cell_value = df.at[0, 'ColumnName']  # 通过行索引和列名称访问
print(f"特定单元格的内容: {cell_value}")

在这个 pandas 示例中,我们使用了 pd.read_excel() 函数来读取 Excel 文件,并将其内容加载到一个 DataFrame 对象中。然后,我们打印了 DataFrame 的内容,并演示了如何访问特定单元格的内容。

© 版权声明
THE END
喜欢就点个赞,支持一下吧!
点赞10 分享
评论 抢沙发
头像
欢迎您留下评论!
提交
头像

昵称

取消
昵称表情代码图片

    暂无评论内容