python 在使用 requests 获取网页信息输出到命令行时报错:

UnicodeEncodeError: 'gbk' codec can't encode character '\u2122' in position 40471: illegal multibyte sequence

字面意思是,统一编码错误:gbk 编码器不能对字符 \u2122 进行编码,不合法的多字节序列。\u2122 是字符 TM 的 Unicode 码,gbk 不支持编译。直接设置输出信息编码格式为 utf8 即可。

import requests
r = requests.get('https://www.seasidecrab.com/') # 个人主页
print(r.status_code)
print(r.text.encode('utf8', 'ignore'))