Багато разів, це програмний додаток потрібно для створення довідкових документів в форматі файлу Microsoft Word. Іноді додаток навіть очікується отримання файлів Word, в якості вхідних даних.
Будь-який програміст Java, який хоче створювати файли MS-Office, а вихід повинен використовувати зумовлений і тільки для читання API, щоб зробити це.
Що таке Apache POI?
Apache POI є популярним API, який дозволяє програмістам створювати, змінювати і відображати файли MS-Office, за допомогою програм Java. Це відкрита бібліотека джерела, розробляється і поширюється Apache Software Foundation, щоб розробляти і модифікувати файли MS-Office, за допомогою програми Java. Він містить класи і методи для декодування призначеного для користувача введення даних або файлу в документи MS-Office.
Компоненти Apache POI
Apache POI містить класи і методи для роботи на всіх OLE2 Складові документи MS-Office. Перелік компонентів цього API наведено нижче:
POIFS (Погано Obfuscation Реалізація файлової системи): Цей компонент є основним фактором всіх інших елементів POI. Він використовується для читання різних файлів в явному вигляді.
HSSF (Horrible Spreadsheet Format): Він використовується для читання і запису формат .xls файлів MS-Excel.
XSSF (XML Spreadsheet Format): Використовується для .xlsx форматі файлу MS-Excel.
HPSF (Horrible Set Property Format): Використовується для вилучення наборів властивостей файлів MS-Office.
HWPF (Horrible текстовий процесор Формат): Він використовується для читання і запису розширенням .doc файли MS-Word.
XWPF (XML текстовий процесор Формат): Він використовується для читання і запису .docx розширення файлів MS-Word.
HSLF (Horrible Slide Layout Format): Він використовується для читання, створення та презентації PowerPoint редагування.
HDGF (Horrible діаграмних Формат): Він містить класи і методи для MS-Visio бінарних файлів.
HPBF (Horrible Видавця Формат): Він використовується для читання і запису MS-Publisher файли.
Цей підручник проведе вас через процес роботи з файлами MS-Word за допомогою Java. Тому обговорення обмежується HWPF і XWPF компонентів.
Ця глава проведе вас через процес налаштування Apache POI на системах Windows, і Linux на основі. Apache POI може бути легко встановлена і інтегрована з поточної середовища Java, після декількох простих кроків, без яких-небудь складних процедур налаштування. Адміністрування користувачів потрібно під час установки.
Системні вимоги
Java SE 2 JDK 1.5 або вище
Тут термін "документ" посилається на файл MS-Word. Після завершення цієї глави, ви зможете створювати нові документи і відкривати існуючі документи, використовуючи програму Java.
Створення порожнього документа
Наступна проста програма використовується для створення порожній документ MS-Word:
Збережіть наведений вище код Java какCreateDocument.java, а потім скомпілювати і виконати його з командного рядка таким чином:
Якщо у вашому середовищі система налаштована з бібліотекою POI, він буде скомпілювати і виконати. щоб створити порожній файл з ім'ям Excelcreatedocument.docx в поточному каталозі і відобразить наступний висновок в командному рядку:
У цьому розділі ви дізнаєтеся, як створити пункт і як додати його в документ за допомогою Java. Пункт є частиною сторінки в файлі Word.
Після завершення цієї глави ви зможете створити пункт і виконувати операції читання на ньому.
створити пункт
Перш за все, давайте створимо абзацу, використовуючи посилання класів, розглянуті в попередніх розділах. Дотримуючись в попередньому розділі, створити документ, а потім ми можемо створити пункт.
Наступний фрагмент коду використовується для створення таблиці:
Біжіть по пункту
Ви можете ввести текст або будь-який інший об'єкт елемент, іспользуякоманду Виконати. Використання екземпляра абзацу можна создатьпрогон.
Наступний фрагмент коду використовується для створення Run.
Написати в пункті
Давайте спробуйте ввести деякий текст в документ. Розглянемо нижче текстові дані:
Наступний код використовується для запису вищезгаданих даних в пункті.
Збережіть наведений вище код Java какCreateParagraph.java, а потім скомпілювати і запустити його з командного рядка таким чином:
Він буде скомпілювати і виконати. щоб створити файл з ім'ям Word, createparagraph.docx в поточному каталозі. і ви отримаєте наступний висновок в командному рядку:
Файлcreateparagraph.docx виглядає наступним чином.
У цьому розділі ви дізнаєтеся, як застосувати кордон до пункту з використанням програмування Java.
застосування Border
Наступний код використовується для застосування кордонів в документі:
Збережіть наведений вище код в файлі з іменемApplyingBorder.java, скомпілювати і виконати його з командного рядка таким чином:
Якщо ваша система налаштована з бібліотекою POI, то він буде скомпілювати і виконати. щоб створити документ Word. з іменемapplyingborder.docx в поточному каталозі і відобразить наступний висновок:
Файлapplyingborder.docx виглядає наступним чином:
У цьому розділі ви дізнаєтеся, як створити таблицю даних в документі. Ви можете створити дані таблиці з помощьюXWPFTable класу. При додаванні каждойстрокі таблиці і додавання кожного осередку встроке, ви отримаєте дані таблиці.
створити таблицю
Наступний код використовується для створення таблиці в документі:
Збережіть наведений вище код в файлі з іменемCreateTable.java скомпілювати і виконати його з командного рядка в такий спосіб.:
Це створює файл з ім'ям Word, createtable.docx в поточному каталозі і відображає наступний висновок в командному рядку:
Файлcreatetable.docx виглядає наступним чином:
У цьому розділі показано, як застосовувати різні стилі шрифтів і вирівнювання в документі Word, за допомогою Java. Як правило, стиль шрифту містить: розмір шрифту, тип, жирний, курсив і підкреслення. І Вирівнювання підрозділяється на лівий, центральний, правий, і виправдати.
стиль шрифту
Наступний код використовується для установки різних стилів шрифту:
Збережіть наведений вище код. какFontStyle.java. а потім скомпілювати і виконати його з командного рядка таким чином:
Це створить файл з ім'ям Word, fontstyle.docx в поточному каталозі і відображає наступний висновок в командному рядку:
Файлfontstyle.docx виглядає наступним чином.
Наступний код використовується для установки вирівнювання для тексту абзацу:
Збережіть наведений вище код. какAlignParagraph.java. а потім скомпілювати і виконати його з командного рядка таким чином:
Це створить файл з ім'ям Word, alignparagraph.docx в поточному каталозі і відобразить наступний висновок в командному рядку:
Файлalignparagraph.docx виглядає наступним чином:
У цьому розділі наведено відомості як витягувати текстові дані з документа Word, за допомогою Java. У разі, якщо ви хочете отримати метадані з документа Word, використовувати Apache Тіка.
Для .docx файлів, ми використовуємо клас org.apache.poi.xwpf.extractor.XPFFWordExtractor, який витягує і повертає прості дані з файлу Word. Таким же чином, ми маємо різні методології для вилучення заголовків, виносок, дані таблиці і т.д. з файлу Word.
Наступний код показує, як витягти простий текст з файлу Word:
Збережіть наведений вище код. какWordExtractor.java скомпілювати і виконати його з командного рядка в такий спосіб.:
Він буде генерувати наступний висновок: