Apache poi слово інструкція

Багато разів, це програмний додаток потрібно для створення довідкових документів в форматі файлу Microsoft Word. Іноді додаток навіть очікується отримання файлів Word, в якості вхідних даних.

Будь-який програміст Java, який хоче створювати файли MS-Office, а вихід повинен використовувати зумовлений і тільки для читання API, щоб зробити це.

Що таке Apache POI?

Apache POI є популярним API, який дозволяє програмістам створювати, змінювати і відображати файли MS-Office, за допомогою програм Java. Це відкрита бібліотека джерела, розробляється і поширюється Apache Software Foundation, щоб розробляти і модифікувати файли MS-Office, за допомогою програми Java. Він містить класи і методи для декодування призначеного для користувача введення даних або файлу в документи MS-Office.

Компоненти Apache POI

Apache POI містить класи і методи для роботи на всіх OLE2 Складові документи MS-Office. Перелік компонентів цього API наведено нижче:

POIFS (Погано Obfuscation Реалізація файлової системи): Цей компонент є основним фактором всіх інших елементів POI. Він використовується для читання різних файлів в явному вигляді.

HSSF (Horrible Spreadsheet Format): Він використовується для читання і запису формат .xls файлів MS-Excel.

XSSF (XML Spreadsheet Format): Використовується для .xlsx форматі файлу MS-Excel.

HPSF (Horrible Set Property Format): Використовується для вилучення наборів властивостей файлів MS-Office.

HWPF (Horrible текстовий процесор Формат): Він використовується для читання і запису розширенням .doc файли MS-Word.

XWPF (XML текстовий процесор Формат): Він використовується для читання і запису .docx розширення файлів MS-Word.

HSLF (Horrible Slide Layout Format): Він використовується для читання, створення та презентації PowerPoint редагування.

HDGF (Horrible діаграмних Формат): Він містить класи і методи для MS-Visio бінарних файлів.

HPBF (Horrible Видавця Формат): Він використовується для читання і запису MS-Publisher файли.

Цей підручник проведе вас через процес роботи з файлами MS-Word за допомогою Java. Тому обговорення обмежується HWPF і XWPF компонентів.

Ця глава проведе вас через процес налаштування Apache POI на системах Windows, і Linux на основі. Apache POI може бути легко встановлена ​​і інтегрована з поточної середовища Java, після декількох простих кроків, без яких-небудь складних процедур налаштування. Адміністрування користувачів потрібно під час установки.

Системні вимоги

Java SE 2 JDK 1.5 або вище

Тут термін "документ" посилається на файл MS-Word. Після завершення цієї глави, ви зможете створювати нові документи і відкривати існуючі документи, використовуючи програму Java.

Створення порожнього документа

Наступна проста програма використовується для створення порожній документ MS-Word:

Збережіть наведений вище код Java какCreateDocument.java, а потім скомпілювати і виконати його з командного рядка таким чином:

Якщо у вашому середовищі система налаштована з бібліотекою POI, він буде скомпілювати і виконати. щоб створити порожній файл з ім'ям Excelcreatedocument.docx в поточному каталозі і відобразить наступний висновок в командному рядку:

У цьому розділі ви дізнаєтеся, як створити пункт і як додати його в документ за допомогою Java. Пункт є частиною сторінки в файлі Word.

Після завершення цієї глави ви зможете створити пункт і виконувати операції читання на ньому.

створити пункт

Перш за все, давайте створимо абзацу, використовуючи посилання класів, розглянуті в попередніх розділах. Дотримуючись в попередньому розділі, створити документ, а потім ми можемо створити пункт.

Наступний фрагмент коду використовується для створення таблиці:

Біжіть по пункту

Ви можете ввести текст або будь-який інший об'єкт елемент, іспользуякоманду Виконати. Використання екземпляра абзацу можна создатьпрогон.

Наступний фрагмент коду використовується для створення Run.

Написати в пункті

Давайте спробуйте ввести деякий текст в документ. Розглянемо нижче текстові дані:

Наступний код використовується для запису вищезгаданих даних в пункті.

Збережіть наведений вище код Java какCreateParagraph.java, а потім скомпілювати і запустити його з командного рядка таким чином:

Він буде скомпілювати і виконати. щоб створити файл з ім'ям Word, createparagraph.docx в поточному каталозі. і ви отримаєте наступний висновок в командному рядку:

Файлcreateparagraph.docx виглядає наступним чином.

Apache poi слово інструкція

У цьому розділі ви дізнаєтеся, як застосувати кордон до пункту з використанням програмування Java.

застосування Border

Наступний код використовується для застосування кордонів в документі:

Збережіть наведений вище код в файлі з іменемApplyingBorder.java, скомпілювати і виконати його з командного рядка таким чином:

Якщо ваша система налаштована з бібліотекою POI, то він буде скомпілювати і виконати. щоб створити документ Word. з іменемapplyingborder.docx в поточному каталозі і відобразить наступний висновок:

Файлapplyingborder.docx виглядає наступним чином:

Apache poi слово інструкція

У цьому розділі ви дізнаєтеся, як створити таблицю даних в документі. Ви можете створити дані таблиці з помощьюXWPFTable класу. При додаванні каждойстрокі таблиці і додавання кожного осередку встроке, ви отримаєте дані таблиці.

створити таблицю

Наступний код використовується для створення таблиці в документі:

Збережіть наведений вище код в файлі з іменемCreateTable.java скомпілювати і виконати його з командного рядка в такий спосіб.:

Це створює файл з ім'ям Word, createtable.docx в поточному каталозі і відображає наступний висновок в командному рядку:

Файлcreatetable.docx виглядає наступним чином:

Apache poi слово інструкція

У цьому розділі показано, як застосовувати різні стилі шрифтів і вирівнювання в документі Word, за допомогою Java. Як правило, стиль шрифту містить: розмір шрифту, тип, жирний, курсив і підкреслення. І Вирівнювання підрозділяється на лівий, центральний, правий, і виправдати.

стиль шрифту

Наступний код використовується для установки різних стилів шрифту:

Збережіть наведений вище код. какFontStyle.java. а потім скомпілювати і виконати його з командного рядка таким чином:

Це створить файл з ім'ям Word, fontstyle.docx в поточному каталозі і відображає наступний висновок в командному рядку:

Файлfontstyle.docx виглядає наступним чином.

Apache poi слово інструкція

Наступний код використовується для установки вирівнювання для тексту абзацу:

Збережіть наведений вище код. какAlignParagraph.java. а потім скомпілювати і виконати його з командного рядка таким чином:

Це створить файл з ім'ям Word, alignparagraph.docx в поточному каталозі і відобразить наступний висновок в командному рядку:

Файлalignparagraph.docx виглядає наступним чином:

Apache poi слово інструкція

У цьому розділі наведено відомості як витягувати текстові дані з документа Word, за допомогою Java. У разі, якщо ви хочете отримати метадані з документа Word, використовувати Apache Тіка.

Для .docx файлів, ми використовуємо клас org.apache.poi.xwpf.extractor.XPFFWordExtractor, який витягує і повертає прості дані з файлу Word. Таким же чином, ми маємо різні методології для вилучення заголовків, виносок, дані таблиці і т.д. з файлу Word.

Наступний код показує, як витягти простий текст з файлу Word:

Збережіть наведений вище код. какWordExtractor.java скомпілювати і виконати його з командного рядка в такий спосіб.:

Він буде генерувати наступний висновок:

Схожі статті