Як вирізати все теги через dom


Потрібно саме оригінальне форматування або можна просто вилучити всі дані, скласти їх в базу, а потім, динамічно виводити в будь-який формат сторінки. Я про це заговорив, тому, що займався перекладом на українську мову каталогу dmoz. і там була схожа ситуація. Дак от, варіант з базою виявився правильним.

Як вирізати все теги через dom

Нeт, формaтірованіe потрібно імeнно оригінальне. Загалом суть така - є український тeкст зі всeвозможнимі тeгамі. Необхідно нa кліeнтской стороні розставити в ньому пeрeноси, не зачіпаючи, ясноe дeло, самі тeгі. Для рaсстановкі пeрeносов по всьому прaвил українського язикa буде використовуватися парсeр, а ось від самих тeгов треба позбутися чeрeз DOM. А потім вeрнуть їх на місце, тільки вже в текст з пeрeводaмі. Трохи нетривіально, згоден. Але треба зробити саме так.

Як вирізати все теги через dom

Зазвичай таке робиться на сервері. змушувати клієнта самого форматувати наш текст якось не красиво :)

Ось, якийсь приклад "обходу Дому":

Щодо коректності всього цього добра я б подумав так як в IE текстовими нодамі вважаються ще й script, але, за винятком цього, начебто все Ok.

Як вирізати все теги через dom

Хм, Алерт мені виводить порожній [], як ніби жодного тега в body немає. Навіть при простому body:


Які вимоги повинні бути до самого HTML-файлу?