使用xlrd库的dump_cell方法时如何解决"UnicodeDecodeError"错误？

问题现象与背景

在使用Python的xlrd库处理Excel文件时，dump_cell方法是常用功能之一，用于以可读格式输出单元格内容。但当Excel文件中包含非ASCII字符（如中文、日文或特殊符号）时，开发者经常会遇到如下报错：

UnicodeDecodeError: 'ascii' codec can't decode byte 0xXX in position YY: ordinal not in range(128)

这个错误表明系统尝试用ASCII编码解析包含多字节字符的内容，而ASCII仅支持0-127的字符范围。

该问题主要由以下因素导致：

import xlrd
book = xlrd.open_workbook("file.xls", encoding_override="utf-8")

通过encoding_override参数显式声明文件编码，建议优先尝试UTF-8、GB18030等常见编码。

cell = sheet.cell(row, col)
content = cell.value.encode('latin1').decode('gbk')

适用于已知特定编码的情况，需注意处理异常。

import locale
locale.setlocale(locale.LC_ALL, 'zh_CN.UTF-8')

修改系统默认编码环境，影响全局设置。

如openpyxl或pandas等现代库对Unicode支持更好：

import pandas as pd
df = pd.read_excel("file.xlsx")

with open("file.xls", "rb") as f:
    book = xlrd.open_workbook(file_contents=f.read())

xlrd 2.0+版本不再支持.xlsx格式，可回退到1.2.0版本：

pip install xlrd==1.2.0

Excel文件本质上是复合二进制文档，其字符串存储涉及：

理解这些底层机制有助于更灵活地处理编码问题。