如何解决loguru库add_level_pickle方法导致的序列化错误？

问题背景与现象

在使用Python的loguru库进行日志管理时，add_level_pickle方法允许将自定义日志级别与序列化功能结合。但当尝试序列化包含复杂对象的日志记录时，常会遇到以下典型错误：

TypeError: cannot pickle 'module' object
或
AttributeError: Can't pickle local object

这类错误通常发生在以下场景：

日志消息包含不可序列化的Python模块
自定义日志处理器使用了lambda函数或局部函数
日志记录包含线程锁等特殊对象

根本原因分析

Python的pickle序列化机制存在以下限制：

无法序列化模块级别的代码对象
动态生成的函数（如lambda）缺乏必要的引用信息
某些系统资源对象（如文件句柄）不具备序列化能力

当add_level_pickle尝试将这些对象写入磁盘或通过网络传输时，就会触发序列化异常。

解决方案与代码示例

方案1：使用可序列化的数据结构

from loguru import logger
import pickle

def serializable_wrapper(obj):
    # 转换为基本数据类型
    if hasattr(obj, '__dict__'):
        return obj.__dict__
    return str(obj)

logger.add("file.log", serialize=True, pickle_dump=serializable_wrapper)

方案2：自定义序列化处理器

import json
from loguru import logger

class CustomSerializer:
    def __init__(self, encoder=None):
        self.encoder = encoder or json.JSONEncoder
    
    def __call__(self, record):
        record["extra"] = {k: str(v) for k,v in record["extra"].items()}
        return record

logger = logger.patch(CustomSerializer())
logger.add("file.log", serialize=True)

方案3：使用替代序列化协议

import dill  # 替代pickle的扩展库

logger.add(
    "file.log",
    serialize=True,
    pickle_dump=lambda obj: dill.dumps(obj, protocol=dill.HIGHEST_PROTOCOL)
)

性能优化建议

策略	优点	适用场景
预转换复杂对象	减少序列化时开销	高频日志场景
使用二进制协议	提高序列化速度	大型日志文件
异步序列化	避免阻塞主线程	实时系统

最佳实践

在日志记录前对复杂对象调用str()或repr()
避免在日志extra字段中直接存储业务对象
为自定义类实现__reduce__方法支持pickle
考虑使用json替代pickle提高兼容性

高级技巧：诊断序列化问题

使用pickletools分析序列化失败原因：

import pickletools

def debug_serialization(obj):
    try:
        data = pickle.dumps(obj)
        pickletools.dis(data)
    except Exception as e:
        print(f"Serialization failed: {str(e)}")