Można by zaprzęgnąć skrypt Pythona z biblioteką python-docx:
pip install python-docx
from docx import Document
import os
import re
import sys
import glob
import ntpath
args = sys.argv[1:]
if len(args) == 0:
files_directory = input("Wprowadź ścieżkę katalogu z plikami DOCX: ")
else:
files_directory = args[0]
if not os.path.isdir(files_directory):
print("Katalog o wskazanej ścieżce nie istnieje.")
exit(1)
regex = re.compile("[\"„](.*?)[\"”]")
docx_files = glob.glob(f"{files_directory}/*.docx")
if len(docx_files) == 0:
print("Nie znaleziono plików DOCX w katalogu o podanej ścieżce.")
exit(0)
for file in docx_files:
doc = Document(file)
for paragraph in doc.paragraphs:
regex_result = regex.findall(paragraph.text)
if regex_result:
for group_value in regex_result:
print(f"{ntpath.basename(file)} => {group_value}")
Pewnie można szybciej/lepiej, nie pisuję zbyt wiele w Pythonie.