Summa Technologiae - Obróbka tekstu
gorat - 21 Października 2013, 12:52
Jedź po tym regexem, prawie każdy język skryptowy/programowania obsługuje.
ketyow - 21 Października 2013, 14:29
Będę musiał spróbować. Natomiast jeśli otwieram HTML w Wordzie (w HTML nie ma już punktorów, są "minusy") i chcę zamienić te minusy na myślniki przy pomocy "wyszukaj i zamień" co byłoby najprostsze, to niestety Word nie do końca współpracuje z HTML i nie rozpoznaje minusów jako minusy, tylko jako krzaczki jakieś. Kopiuję ten minus i wklejam do szukajki, ale zamiast niego pojawia się krzak, każę ten krzak w całym dokumencie zamienić na myślniki, ale zamiast myślników pojawiają się kwadraciki - czyli nieznany znak. Dzieje się tak dlatego, że (co widać w kodzie html) te punktory konwertuje na symbole, a nie normalny tekst. I Word potrafi to wyświetlić, ale nie umie nic z tym zrobić.
Notepad++ nie wyszukuje natomiast wymienionego przeze mnie kodu, ponieważ ten kod jest na tyle długi, że gdy wyświetla się na ekranie, to aż na trzech linijkach. Ten kod występuje 790 razy w tekście, ale łamany jest (tzn. przenoszony do nowej linii) w wielu różnych miejscach, a niestety szukajka Notepada uznaje znak końca linii. Zatem nie da rady się tego łatwo pozbyć.
ketyow - 21 Października 2013, 14:48
Ok, zrobiłem to jednak Wordem. Najpierw w Docx zmieniłem punktory z myślników, na jakiś tam inny symbol. Następnie przekonwertowałem dokument do HTML. Wtedy zaznaczyłem taki symbol punktora i kazałem wszystkie zamienić na myślnik. Zadziałało. Musi być to jakiś bug w Wordzie. Jeśli Word ma symbol punktora ustawiony na myślnik, to po konwersji na HTML ten myślnik jest widziany jako minus, a po zaznaczeniu i wklejeniu do szukajki okazuje się, że to nawet nie jest minus, tylko coś dziwnego, czego Word nie potrafi rozpoznać i zamienia na kwadraciki.
Adanedhel - 24 Października 2013, 08:20
Word zamienia myślniki na punktory w ramach autokorekty, którą można wyłączyć.
Ketyow, odpowiem Ci dlaczego DTP nie trzyma plików w Wordzie - ponieważ ma pliki edytowalne w InDesignie, Quarku czy dowolnym innym programie do składów. Gdy wlewa się tekst z Worda do tych programów, wiele formatowań szlag trafia i tekst trzeba poprawiać od nowa. Wszystko. W całości.
Gdy zmienia format dokumentu w pliku swojego programu, tekst się nie zmienia. Poprawia potem tylko łamanie.
Poprawki często wciąż nanosi się z pomocą znaków korektorskich. Na wydruk z pdf-a. I wiadomo gdzie nanieść te poprawki. Układ tekstów w Wordzie jest inny, szukanie gdzie nanieść tam poprawkę, choćby głupi przecinek, może trwać długo. Dlatego jest bezsensowne. Zdarza się oczywiście, że trzeba tekst z Worda dwa razy wlewać i od początku składać. Ale, mówiąc szczerze (jako copyeditor), wolę dwukrotnie czytać ten sam tekst w dwóch różnych pdf-ach, tylko po to, żeby nanieść te same poprawki, niż nanosić poprawki w pliku u operatora i jednocześnie w Wordzie. To więcej roboty, bo pdfa i tak trzeba potem sprawdzać.
Wyjątkami są sytuacje, gdy klient chce potem dostać też aktualne i poprawione teksty w Wordzie.
PS. Do edycji pdf-ów jest bardzo dobry program. Nie nieomylny, ale naprawdę solidny. Zwie się Infix.
|
|
|