• Najnowsze pytania
  • Bez odpowiedzi
  • Zadaj pytanie
  • Kategorie
  • Tagi
  • Zdobyte punkty
  • Ekipa ninja
  • IRC
  • FAQ
  • Regulamin
  • Książki warte uwagi

Jak wyszukać ciągi znaków między cudzysłowami w MS Word

0 głosów
522 wizyt
pytanie zadane 1 maja 2022 w Systemy operacyjne, programy przez niezalogowany
Mam kilkadziesiąt dokumentów w których muszę znaleźć wszystkie ciągi znaków znajdujące się między cudzysłowami, przeglądanie dokumentów zajmie za dużo czasu, szukam jakiegoś szybszego sposobu.

2 odpowiedzi

0 głosów
odpowiedź 1 maja 2022 przez Velta Maniak (52,910 p.)
edycja 1 maja 2022 przez Velta

Można by zaprzęgnąć skrypt Pythona z biblioteką python-docx:

pip install python-docx
from docx import Document

import os
import re
import sys
import glob
import ntpath

args = sys.argv[1:]

if len(args) == 0:
	files_directory = input("Wprowadź ścieżkę katalogu z plikami DOCX: ")
else:
	files_directory = args[0]
	
if not os.path.isdir(files_directory):
    print("Katalog o wskazanej ścieżce nie istnieje.")
    exit(1)
    
regex = re.compile("[\"„](.*?)[\"”]")

docx_files = glob.glob(f"{files_directory}/*.docx")
if len(docx_files) == 0:
    print("Nie znaleziono plików DOCX w katalogu o podanej ścieżce.")
    exit(0)

for file in docx_files:
    doc = Document(file)
    for paragraph in doc.paragraphs:
        regex_result = regex.findall(paragraph.text)
        if regex_result:
            for group_value in regex_result:
                print(f"{ntpath.basename(file)} => {group_value}")

Pewnie można szybciej/lepiej, nie pisuję zbyt wiele w Pythonie.

0 głosów
odpowiedź 1 maja 2022 przez VBService Ekspert (256,580 p.)
edycja 1 maja 2022 przez VBService

Podobne pytania

0 głosów
0 odpowiedzi 706 wizyt
0 głosów
0 odpowiedzi 3,360 wizyt
pytanie zadane 9 października 2018 w Systemy operacyjne, programy przez seba Dyskutant (8,900 p.)
0 głosów
0 odpowiedzi 558 wizyt

93,731 zapytań

142,668 odpowiedzi

323,286 komentarzy

63,290 pasjonatów

Motyw:

Akcja Pajacyk

Pajacyk od wielu lat dożywia dzieci. Pomóż klikając w zielony brzuszek na stronie. Dziękujemy! ♡

Oto polecana książka warta uwagi.
Pełną listę książek znajdziesz tutaj

Twierdza Linux. Bezpieczeństwo dla dociekliwych

Aby uzyskać rabat -10%, użyjcie kodu pasja-linux, wpisując go w specjalne pole w koszyku.

...