Prezentacijom Misleći uređivač teksta pokušao sam skrenuti pažnju na to većina sadržaja za web nastaje u za to neprikladnim uređivačima teksta. Najčešće ljudi koriste Word, OOWord ili neki sličan dio uredskog paketa. Pri tome ne koriste stilove (čime bi zadržali smislenost) već za naslove, podnaslove i ostale elemente najčešće koriste ručnu promjenu fonta, veličine i oblika slova. Manji dio njih koristi običan uređivač teksta (u narodu su takvi poznatiji kao Notepad), a veći dio koristi neko od html/javascript rješenja. Iako su ti zadnji napravljeni na ciljnjoj platformi oni se najčešće koriste kao primitivna inačica uređivača iz uredskih paketa.
Najavljivan je i semantički web pa se postavlja i pitanje kako će se unositi strukturirani podaci i može li se cijela priča pojednostavniti?! Preletjele su već tri godine otkada sam na ovom blogu pisao o WYSIWYM mantri i predstavio ideju o pravom web uređivaču teksta. WYMeditor u te tri godine nije napravio značajniji pomak, cijela WYSIWYM ideja se pomalo zagubila, a najsimptomatičnije u cijeloj toj priči je da WYMeditor nema klonova.
Da li je WYSIWYM propala ideja? Oni koji su je primijenili u praksi ne misle tako. WYMeditor se nudi kao izbor u brojnim CMS-ovima i onima koji unose tekst olakšava prepoznavanje osnovnih HTML elemenata, a rezultat unosa je kod u skladu sa standardima.
Bilo bi odlično kad bi takav uređivač postojao i kao obična aplikacija, što bi omogučilo unos strukturiranog teksta i u off-line načinu rada. Kako preglednici nisu baš najstabilniji, a i CMS-ovi imaju svoje bubice, često se događa da unositelji teksta ostanu bez svojeg uratka. Zbog toga bi jedna stabilna, off-line aplikacija imala svoj krug korisnika. I još kad bi uz pomoć nekog API-ja mogli poslati tekst direktno u CMS nitko sretniji od njih. Uz pomoć Adobe AIR-a ili Titanium appceleratora ne bi bilo teško WYMeditor pretvoriti u desktop aplikaciju.
Tu se postavlja i pitanje formata u kojem bi se takvi tekstovi čuvali. Standardni formati (doc, docx, odf), unatoč tome što koketiraju s xml-om, nisu najsretnije rješenje. Ako već radimo html, zbog čega on i ne ostane html? Slična ideja se nedavno pojavila na A List Apart Magazinu gdje u članku Web Standards for E-books piše...
The canonical format of a book should be HTML. Authors should write in HTML, making a manuscript immediately transformable to an E-book. A manuscript could then be imported into that fossil the publishing industry refuses to leave behind, Microsoft Word.
HTML/XHTML su vrlo čitljivi, čisti i jasni formati, zašto inzistirati na nekim drugim formatima dokumenata kad nam oni nude ono što je većini korisnika potrebno, a ne moraju se mučiti s konverzijama između različitih formata?! Kad bi tako postavili stvari svi zajedno bi imali puno manje uzaludnog posla (kao što je skidanje stilova nakon copy&paste operacije i ponovno preoblikvanje teksta).
Osnovni problem HTML-a je upravo što on nudi za takvu svrhu. Primjerice, naslovi nisu definirani hijerarhijski već tagovima od h1 do h6; također naslovi nisu nikako vezani uz poglavlja kojima pripadaju, itd.
Zato je za potrebe tehničke dokumentacije razvijen drugi markup jezik, , koji se za razliku od HTML-a bazira na XML-u (HTML je implementacija SGML-a; XHTML je HTML definiran prema pravilima XML-a), a vrlo se jednostavno može primijeniti na bilo koju vrstu tiskanog (ili online) izdanja.