PDF, DOC, a może jeszcze coś innego?

 

Informacje prasowe, które trafiają do redakcji, mają postać plików różnego rodzaju. Jedne są bardzo łatwe do przekopiowania – czy to na portal, czy do programu DTP (dziś najpopularniejszym programem do składu tekstu jest InDesign firmy Adobe), inne z kolei – bardzo trudne. Jaki zatem jest idealny format do dalszej pracy nad tekstem?

Autorzy informacji prasowych często zapominają, że ich dzieło nie jest informacją finalną, jaka ukaże się na stronie WWW czy w czasopiśmie. Dlatego – co zrozumiałe – starają się o to, żeby treść była przekazana w najpiękniejszej formie. Nie zastanawiają się, że jeśli tekst ma być dalej przetwarzany, to wcale nie wygląd jest najważniejszy.

Zwykle informacje prasowe wysyłane są w trzech formatach plików: TXT, PDF lub DOC (DOCX).

 

TXT

Tekst w pliku TXT jest tekstem „surowym”, bez żadnych znaczników związanych z formatowaniem tekstu, zatem można go w bezpieczny i wygodny sposób przenieść – zarówno na portal jak i do InDesigna. Zostaje po prostu skopiowany zestaw znaków ANSI wzbogacony jedynie o znaki końca wiersza. Jest to idealny format do wklejenia i rozpoczynania jego obróbki w innym edytorze – czy to InDesignem, czy edytorem właściwym dla systemu CMS (Content Management System – system zawiadujący treścią strony internetowej). Dopiero na takim „surowym” tekście rozpoczyna się właściwe formatowanie w miejscu docelowym.

Kolejna zaleta to taka, że w pliku TXT nie można przesłać żadnych zdjęć, więc rzeczywiście plik jest czystym plikiem tekstowym.

Format TXT, przez to, że jest pozbawiony wszelkich znaczników, ma też jednak jedną podstawową wadę – jest pozbawiony wszelkich znaczników. Brzmi to paradoksalnie, ale posłużę się przykładem: w przesłanej notce często przywoływana jest wypowiedź fachowca, która w miejscu docelowym powinna być sformatowana jest jako pismo pochyłe (kursywa).  Niestety w formacie TXT nie ma takiej możliwości.

Kolejna wada to wymuszanie przenoszenia np. pojedynczej litery z wiersza do wiersza poniżej lub formatowania spacjami (patrz niżej). Ale jest to przypadłość związana z autorem takiego tekstu, a nie formatem pliku.

 

DOC (DOCX)

Pliki typu DOC to pliki, w których tekst jest sformatowany. Pliki DOC to format najpopularniejszego edytora tekstów jakim jest Word. Są tu więc widoczne atrybuty tekstu (formatowanie), mogą być także zamieszczone w tekście zdjęcia oraz np. indeksy.

Autor takiego tekstu zwykle sugeruje, jak taki tekst powinien wyglądać (no bo jest już sformatowany) – dodaje swoje wytłuszczenia (tekst pogrubiony), wstawia w odpowiednie miejsca pismo pochyłe oraz ilustracje.

Jeśli tekst w formacie DOC jest przygotowany dobrze, jest znacznym ułatwieniem dla redakcji, webmastera czy operatora DTP, bowiem kopiując tekst przenosi się zwykle podstawowe atrybuty takie jak kursywa i pismo pogrubione. Dzięki temu operator ma mniej pracy, ponieważ nie musi sam formatować pisma. Nie chodzi tu tylko o nadmiar pracy, ale także o możliwość popełnienia błędu przy zaznaczaniu odpowiednich fragmentów, które trzeba wytłuścić lub pochylić.

Z drugiej strony ważne jest odpowiednie przygotowanie takiego tekstu. Niestety muszę zauważyć, że większość osób bardzo słabo zna ten edytor, w związku z czym przygotowuje pliki tak, jak umie.

Podstawowe błędy w przygotowaniu takich plików to:

  1. stosowanie tabulatora w miejsce automatycznego wcięcia akapitowego,
  2. stosowanie miliona spacji do osiągnięcia odpowiedniego efektu, którym zwykle jest uzyskanie odpowiedniego wcięcia akapitowego lub innego,
  3. stosowanie znaku końca wiersz w miejsce spacji nierozdzielającej.

Ad. 1. Jeśli przekopiujemy tekst z takimi tabulatorami, to – aby poprawnie sformatować tekst w miejscu docelowym – trzeba te tabulatory usunąć. Jest to niepotrzebna praca i strata czasu.

Ad 2. Częsty przypadek w sytuacjach, kiedy autor zamierza stworzyć coś w rodzaju tabeli.

Ad 3. Ponieważ twórcy takich dokumentów nie potrafią wygenerować spacji nierozdzielającej (generuje się ją klawiszami Ctrtl+Alt+Spacja), używają znak końca wiersza, aby wymusić przeniesienie pojedynczej ostatniej litery w wierszu do wiersza następnego.

Efekt – po przekopiowaniu – może wyglądać np. tak:

 

Dzięki temu operator ma mniej pracy, ponieważ nie musi sam formatować pisma. Nie chodzi tu tylko¶

o nadmiar pracy, ale także¶

o możliwość popełnienia błędu przy zaznaczaniu odpowiednich fragmentów, które trzeba wytłuścić lub pochylić.

 

Oczywiście tekst ten będzie wyglądać różnie, w zależności od szerokości łamu.

Wszystkie tego typu wstawki (tabulatory, „entery” oraz dziesiątki niepotrzebnych spacji) trzeba oczywiście ręcznie usunąć. Jest to spora praca, trwająca zwykle dłużej, niż samo formatowanie tekstu w miejscu docelowym, w dodatku łatwo o pomyłkę (i wykasowanie np. sąsiedniej litery w wyrazie czy nawet całego słowa).

Jak prawidłowo formatować tekst – o tym będzie traktował jednej z kolejnych wpisów na blogu.

Jeśli do pliku tekstowego w formacie DOC wstawione zostaną zdjęcia, to zwykle zostaną one przeniesione do edytora docelowego. Ale przeważnie i tak je trzeba będzie usunąć. Dlaczego? Jeśli formatujemy stronę WWW to osadzanie zdjęć z dokumentu, który za chwilę może zostać usunięty, jest pomysłem ryzykownym – zdjęcie w takim przypadku powinno być zaimportowane do biblioteki mediów i dopiero stamtąd osadzone w odpowiednim miejscu na stronie. Daje to gwarancję, że zdjęcie nie zniknie po usunięciu pliku DOC (lub zmianie jego miejsca w katalogach). Z kolei przy składzie tekstu do druku potrzebne są zdjęcia o wysokiej rozdzielczości (wynikowo w druku powinno być ok. 300 dpi, a więc punktów na cal). Takie zdjęcia osadzone w pliku DOC powodowałyby, że plik taki miałby wiele MB i nie nadawałby się do przesłania mailem. Dlatego i tak ilustracje muszą być załączone osobno, często są zatem przesyłane przez odpowiednie strony WWW (typu WeTransfer, Przesyłarka, Dropbox, itp.). Przekopiowane z Worda przeważnie nie nadają się do druku. A co, jeśli zdjęcie jest tylko jedno osadzone w pliku DOC i ma odpowiednią rozdzielczość? Wtedy teoretycznie takie zdjęcie technicznie nadaje się do druku, ale…

Są dwa sposoby „wydłubania” takiego zdjęcia z pliku. Pierwszy – to przekopiowanie zdjęcia metodą Ctrl+ C oraz Ctrl+V do innego praktycznie dowolnego programu graficznego. Jednakże często ta metoda zawodzi, gdyż zostają utracone informacje o kolorze (trudno generalizować, co się dzieje, ale uzyskuje się efekt zmiany kolorów lub rozdzielczości). Drugi sposób to zapis takiego pliku jako strona html oraz odszukanie odpowiedniej ilustracji na dysku w katalogu takiego dokumentu. Zwykle taki dokument zawiera znacznie więcej ilustracji (logo firmy, graficzne nagłówki), więc odszukanie właściwego zdjęcia chwilę trwa. No i potem warto takie niepotrzebne pliki usunąć z dysku. Nie muszę dodawać, że to wszystko trwa… A wystarczy dołączyć zdjęcie poza plikiem DOC w osobnym pliku graficznym.

 

PDF

PDF jest formatem, który służy do obrazowania w kompletny sposób obrazu strony zawierającej tekst i grafikę. Od typowego zdjęcia/ilustracji różni się tym, że tekst zakodowany jest w nim jako standardowy tekst, zatem teoretycznie można skopiować z pliku PDF treść w formie tekstowej. Jest to oczywiście teoria, bowiem przy próbie kopiowania tekstu kopiuje się jego format związany z układem na stronie, czyli każdy wiersz ze strony zapisanej w PDF przekopiuje się w formie wiersza zakończonego znakiem końca wiersza do każdego edytora. Proszę sobie wyobrazić teraz usuwanie wszystkich znaków końca wiersza z dokumentu! Jest to czasochłonne i w dodatku nie można tego zrobić automatycznie, gdyż czasem znaki końca wiersza są potrzebne (np. na końcu akapitu).

 

Tak wygląda tekst przekopiowany z PDF. Pół biedy, jeśli polskie znaki diakrytyczne przekopiują się prawidłowo…

 

Kolejna sprawa to częste błędy przy przenoszeniu polskich znaków diakrytycznych – nie kopiują się one prawidłowo, a w miejsce „polskich znaków” pojawiają się różne inne znaki, czasami w miejsce pojedynczej litery – dwie inne.

Generalnie PDF służy do przenoszenia plików drukarskich (w miejsce poprzedniego standardu PostScript, czyli języka opisu strony, z którym zresztą PDF ma wiele wspólnego). Można za jego pomocą pokazać redakcji, jak ma wyglądać gotowa strona. Ale zbyt wiele nie da się z takim plikiem zrobić bez dużego nakładu pracy.

Oczywiście jeśli ktoś posiada pakiet do obróbki PDF, np. Adobe Aprobat, poradzi sobie z ograniczeniami formatu PDF. Ale że program ten nie należy do najtańszych zwykle mają go na wyposażeniu studia graficzne i DTP, z którymi redakcje współpracują. Ale w takim przypadku praca nad tekstem wyglądałaby tak, że redaktor po otrzymaniu pliku PDF wysyła go do studia z prośbą o „wydłubanie tekstu), a grafik potem odsyła to, co udało mu się uzyskać. Niepotrzebna strata czasu i kłopot.

 

Inne formaty

Ponieważ format DOC praktycznie należy do firmy Microsoft, a PDF jest autorstwa Adobe, są to formaty ściśle rozwijane przez te firmy. Próbą otwartego standardu, niezwiązanego z firmą, która go forsuje, jest ODT. Jest to format pliku tekstowego zawartego w ramach tzw. OpenDocument, a więc otwartego standardu formatu plików pakietów biurowych (czyli także arkuszy kalkulacyjnych, programów prezentacyjnych, grafiki wektorowej, itp.). Jest to format niezależny od platformy, na jakiej powstał. Wspierają go m.in. bezpłatne pakiety takie jak OpenOffice, StarOffice i inne. Co ważne – większość tych bezpłatnych pakietów obsługuje także standard Microsoft Office, a więc DOC oraz DOCX (w przypadku plików tekstowych).

Zatem do przesyłania informacji można także korzystać z tego sposobu zapisu. Jeśli odbiorca ma kłopot z odczytaniem takiego pliku – wystarczy go poinformować o możliwości pobrania bezpłatnego pakietu, który z powodzeniem zastąpi także microsoftowego Worda. Znam kilka osób, które z powodów finansowych korzystają wyłącznie właśnie z bezpłatnych pakietów biurowych typu „Office”.

Sam sposób zapisu i możliwości bezpośredniego kopiowania tekstu jest podobny do formatu DOC, zatem dotyczą go wszelkie powyższe uwagi związane z umiejętnym formatowaniem tekstu.

Teoretycznie otwartym formatem do przenoszenia tekstów między różnymi platformami i edytorami jest RTF opracowany przez Microsoft. Jest to tekst ze związanymi z nim atrybutami, ale bez niepotrzebnych (w przypadku przesyłaniu informacji) dodatków. Nie jestem fachowcem, ale oceniam RTF jako ogniwo pośrednie między TXT i DOC (lub DOCX). Co ważne – pliki typu RTF powinny być prawidłowo odczytywane przez większość edytorów, a nawet przez czytniki e-booków.

 

Reasumując

Jak wysyłać teksty, aby były jak najłatwiejsze do późniejszej obróbki? To zależy od informacji, jaką tekst niesie.

  1. W przypadku prostej informacji – wystarczy zwykły TXT z opisem miejsca w którym ma być umieszczone zdjęcie (o ile to jest ważne): wpisujemy np. w nowym wierszu: „Zdjęcie 1.”. Dla wyróżnienia można wstawić pusty wiersz przed i za takim wpisem, a wpis wyróżnić np. ostrymi nawiasami lub innym widocznymi znakami (<Zdjęcie 1.>). Jeśli zdjęcie nie musi być w konkretnym miejscu nie potrzeba umieszczać takich znaczników.
  2. W przypadku informacji z większą liczbą cytatów pisanych kursywą – warto wysłać tekst w formacie DOC lub RTF pamiętając, że format DOCX jest nowszy i nie jest zgodny ze starszym standardem DOC. Ktoś, kto używa starszej wersji Worda może mieć kłopot z odczytaniem takiego pliku. Uwaga dotycząca zdjęć – jak wyżej.
  3. Jeśli ważny jest układ tekstu, jaki chce zasugerować redakcji autor – warto wysłać także PDF (ale nie zamiast innych formatów!).

 

Czego nie należy robić?

  1. Nie należy wysyłać tekstu wyłącznie w formacie PDF.
  2. Nie należy wstawiać ilustracji w tekst w formacie DOC, DOCX lub RTF – ilustracje mają być w osobnych plikach (o odpowiedniej rozdzielczości).

Najważniejsze – nie formatować tekstu tabulatorami, spacjami oraz znakami końca wiersza!

Authors

Related posts

Góra
English