Потрібно саме оригінальне форматування або можна просто вилучити всі дані, скласти їх в базу, а потім, динамічно виводити в будь-який формат сторінки. Я про це заговорив, тому, що займався перекладом на українську мову каталогу dmoz. і там була схожа ситуація. Дак от, варіант з базою виявився правильним.
Нeт, формaтірованіe потрібно імeнно оригінальне. Загалом суть така - є український тeкст зі всeвозможнимі тeгамі. Необхідно нa кліeнтской стороні розставити в ньому пeрeноси, не зачіпаючи, ясноe дeло, самі тeгі. Для рaсстановкі пeрeносов по всьому прaвил українського язикa буде використовуватися парсeр, а ось від самих тeгов треба позбутися чeрeз DOM. А потім вeрнуть їх на місце, тільки вже в текст з пeрeводaмі. Трохи нетривіально, згоден. Але треба зробити саме так.
Зазвичай таке робиться на сервері. змушувати клієнта самого форматувати наш текст якось не красиво :)
Ось, якийсь приклад "обходу Дому":
Щодо коректності всього цього добра я б подумав так як в IE текстовими нодамі вважаються ще й script, але, за винятком цього, начебто все Ok.
Хм, Алерт мені виводить порожній [], як ніби жодного тега в body немає. Навіть при простому body:
Які вимоги повинні бути до самого HTML-файлу?