当前位置: 首页 > 新闻动态 > 网络资讯

如何在Python中高效搜索文本文件中的多个字符串并在CSV中定位并输出匹配行

作者:霞舞 浏览: 发布日期:2026-02-02
[导读]:本文介绍一种健壮、可扩展的方法:读取目标数字列表,逐个在CSV文件中精确匹配各字段,避免因换行符、空格或子串误匹配导致的查找失败。

本文介绍一种健壮、可扩展的方法:读取目标数字列表,逐个在csv文件中精确匹配各字段,避免因换行符、空格或子串误匹配导致的查找失败。

在处理类似“从 numberstofind.txt 中读取多个数值,并在 midvalues1.csv 中查找包含该数值的整行”这类任务时,初学者常犯的关键错误包括:

  • 只读取首行(如 fp.readline()),忽略后续数字;
  • 未清理换行符和空白(如 line.strip() 缺失),导致 -56\n 无法匹配 CSV 中的 -56;
  • 使用子串匹配(in)而非字段级匹配,可能引发误匹配(例如搜索 -6 会错误匹配 -62 或 16);
  • 重复打开/关闭文件且逻辑冗余,代码难以维护、易出错。

以下是一个专业、可复用的解决方案:

import csv

# 步骤1:安全读取待搜索数字(自动过滤空行和空白)
with open("numberstofind.txt", "r", encoding="utf-8") as f:
    search_numbers = [line.strip() for line in f if line.strip()]

# 步骤2:对每个数字,在CSV中逐行、逐字段搜索
for idx, target in enumerate(search_numbers, start=1):
    found = False
    with open("midvalues1.csv", "r", encoding="utf-8") as csv_file:
        reader = csv.reader(csv_file)
        for row in reader:
            # 精确匹配:检查 target 是否完整等于某一个单元格(避免子串误匹配)
            if target in row:
                matched_line = ",".join(row)
                print(matched_line)
                print(f"Found {target}!")

                # 写入结果到独立文件
                with open(f"ident{idx}.txt", "w", encoding="utf-8") as 

out_f: out_f.write(matched_line + "\n") found = True break # 找到首个匹配即退出(如需全部匹配,移除此行) if not found: print(f"Data '{target}' not found!")

关键优化说明:

  • ✅ 使用 csv.reader 正确解析 CSV 字段,避免手动 line.split(',') 带来的引号/逗号转义问题;
  • ✅ if target in row: 是字段级匹配(row 是字符串列表),比 target in line(整行字符串)更精准、更安全;
  • ✅ enumerate(..., start=1) 自动编号输出文件(ident1.txt, ident2.txt…),逻辑清晰;
  • ✅ 显式指定 encoding="utf-8" 防止中文或特殊字符读取异常;
  • ✅ 使用 with 语句管理文件,确保自动关闭,无需手动 f.close()。

⚠️ 注意事项:

  • 若 CSV 中数字可能带空格(如 "-56 "),建议统一预处理:row = [cell.strip() for cell in row];
  • 如需部分匹配但防误判(例如匹配 -56 但不匹配 -156),可改用正则:re.search(rf'(^|,)\s*{re.escape(target)}\s*(,|$)', line);
  • 对于超大文件,可将 CSV 先加载为列表缓存一次,避免多次重复读取(本例中小文件推荐当前流式处理)。

该方法结构清晰、容错性强,适用于任意数量的搜索项与标准CSV格式,是生产环境中推荐的实践模式。

免责声明:转载请注明出处:http://m.jing-feng.com.cn/news/803269.html

扫一扫高效沟通

多一份参考总有益处

免费领取网站策划SEO优化策划方案

请填写下方表单,我们会尽快与您联系
感谢您的咨询,我们会尽快给您回复!