Как генерировать документы в word. Автоматическая генерация документов. A, фамилии в столбце B и профессии в столбце C

Все мы имеем дело с текстами, так или иначе. Иногда возникает потребность сгенерировать большое или не очень большое количество текста для каких-либо задач, например, поиграться с форматированием, а текста под рукой нет, самому писать лень. Что делать? Ответ простой: воспользоваться встроенным в Word генератором случайных текстов!

В редакторе Microsoft Word можно генерировать текст достаточно быстро и легко с помощью специальных команд. В качестве подопытного кролика буду использовать Word 2007. Эти команды должны работать во всех версиях Word. Расскажу о трех методах генерации текста.

Метод 1. Использование rand()

Функция rand() вставляет локализованный образец текста, 3 абзаца по 3 предложения. Откройте ваш Word, поставьте курсор в то место, где скоро появится куча текста и введите команду:

и нажмите Enter. Сама функция rand исчезнет и вместо нее появится 3 абзаца текста:

Но это еще не все. Если вам нужно много текста, то можно использовать функцию rand с дополнительными аргументами, вот в таком виде:

=rand(x,y)

где «x » означает количество абзацев, а «y » — количество предложений в каждом абзаце. Например, =rand(20,5) вставит 20 абзацев с пятью фразами в каждом. А =rand(7) вставит 7 абзацев по 3 предложения на каждый.

Метод 2. Использование lorem()

Чтобы вставить старый добрый Lorem Ipsum в качестве образца — применяем функцию lorem(). Введите следующую команду и нажмите Enter:

И получим вот такой всевдо-латинский текст

Функция lorem() также охотно принимает дополнительные аргументы, как и rand(), в виде количества абзацев и предложений. Без аргументов функция вставляет по умолчанию 3 абзаца с тремя предложениями в каждом.

Метод 3. Функция rand.old()

Использование аналолгично предыдущим командам:

=rand.old()

и нажать Enter.

Функция rand.old() оставлена для совместимости со старым офисом, до 2003 включительно. Способ применения такой же, как и у предыдущих двух, только текст будет состоять из одинаковых фраз «Съешь ещё этих мягких французских булок, да выпей чаю». Эту фразу знает каждый, кому приходилось иногда работать со шрифтами.

Можно передавать аргументы, как и в первых двух методах.

Вот и все, текстов нагенерили, теперь можно съесть еще этих мягких французских булок да выпить чаю:)

Получилось ли у вас вставить текст с помощью вышеуказанных функций?

Както раз после подведения итогов олимпиады, когда участникам требовалось разослать письмами с результаты по сданным (или не сданным) предметам, я заметил, что девушка сидит и руками вносит в шаблон письма результаты экзамена, ФИО школьника и прочую информацию. Перед ней лежало несколько распечатанных из Excel листов с фамилиями и оценками. Copy-Paste, Ctrl+C — Ctrl+V, перевод ФИО из именительного в родительный падеж и так уже была проделана работа с половиной первого из трех листов с данными. Сколько по вашему она могла бы еще просидеть копируя данные, а потом проверяя результат? Думаю довольно долго, да и ошибок было бы не мало. А ведь ей потом предстояло еще подписывать почтовые конверты... Мне стало жалко ее времени и за несколько минут я показал, как можно с помощью простых средств этот процесс автоматизировать. После небольшого экскурса ее работа была закончена за 20 минут.

В этом уроке я покажу Вам как можно быстро создавать документы (письма, приглашения) затрачивая на это минимум времени. В разных версиях языках этот описываемый процесс называется по-разному. Так в русском это «Слияние», а в английском - «Merge».

Надеюсь, что «письма счастья» от пенсионного фонда, налоговые уведомления создаются таким же способом:)

Инструменты

Для создания документов нам понадобится OpenOffice Writer. В нем мы будем создавать шаблон письма. Понадобиться так же OpenOffice Calc. В нем мы создадим базу с фамилиями и адресами тех лиц, которых мы, например, хотим пригласить на вечеринку. Вместо программ из пакета OpenOffice легко могут использоваться MS Word и Excel. База данных может легко лежать в MS Access. И так, приступаем.

Создание базы данных

База данных — это ничто иное как таблица в MS Excel или OpenOffice Calc, где данные располагаются в столбцах, а первая строка используется для именования столбцов. Заведем, например, столбцы «ФИО», «город», «индекс», «адрес». Введем данные и сохраним файл на диск.



В качестве баз данных могут использоваться и другие источники, например адресная книга Outlook, или база данных MS Access.

Создание шаблона письма

С созданием шаблона письма дело обстоит чуть сложнее. Поскольку в шаблон будут данные из таблицы (нашей базы данных) подставляться как есть, то и письмо надо писать соответствующим образом. Если у вас в базе данных ФИО идет в именительном падеже, то вряд ли Вам удастся использовать это поле в обращении «Дорогой, <ФИО>!» и для конверта в строке «Кому: <ФИО>». В последнем случае ФИО будет смотреться несколько коряво.

Составляя шаблон письма я рекомендую начать с составления письма какому-то реальному человеку. Можно самому себе. Затем в нем выделить цветом те данные, которые Вы будете брать из базы данных и заменить их на соответствующие поля. Перед тем как заменять выделенный текст на поле рекомендую обратить внимание на то, с какой буквы должно начинаться поле в базе данных (строчной или прописной). Конечно, можно составлять шаблон сразу с полями, но тогда Вы можете не заметить некоторых ляпов, как нестыковка падежей.



Уже в приведенном шаблоне видно, что нам потребуется ФИО в родительном падеже и поле, содержащие только имя и отчество. С первым полем мы можем заменить «Кому» на «Получатель» и тогда ФИО в именительном падеже нас вполне устроит. Со вторым полем все несколько сложнее и нам придется завести в базе данных еще один столбец и заполнить его соответствующими данными. В одном из следующих уроков я расскажу как это сделать автоматически, а пока будем считать что такое поле у нас уже есть.

Для вставки поля и привязки шаблона к базе данных необходимо выполнить следующую последовательность действий. В OpenOffice Writer выбрать базу данных



и нажать «Define» («Определить»).



Затем в нужное место вставить поле из подключенной базы данных. Для этого нажать Ctrl+F2, или в меню «Вставка» выбрать пункт «Поля» и «Другое». В открывшемся окне выбрать вкладку «Базы данных», в типе поля выбрать «Mail Merge fields», из базы данных выбрать соответствующее поле и нажать «Вставит». Собственно базу данных можно также выбрать в этом окне.



После того как одно поле вставлено, можно не закрывая текущего окна выделить текст для замены на следующего поля, выбрать поле и снова нажать «Вставить». И так для каждого из полей.

Для MS Word ситуация в чем-то похожа и, возможно, более удобна. После создания таблицы в MS Excel, запускаем MS Word и переходим на вкладку «Рассылки». На этой вкладке можно увидеть тре необходимых шага: «Начало слияния», «Составление документа и вставка полей» и «Завершение». Есть еще промежуточный шаг «Просмотр результата», но он является опциональным.

И так работа начинается с выбора документа. Это могут быть письма, наклейки, обычный документ Word. Тут же можно запустить мастер слияния, который проведет Вас через все стадии этого процесса. Следующий шаг — выбор получателя, то есть базы данных. Здесь Вы можете выбрать готовую базу данных (например, созданную на предыдущем этапе таблицу MS Excel), или создать новый список. После того как список выбран, становятся активными кнопки «Вставит поле слияния», «Изменить список получателей» и пр. Через диалог «Изменить список получателей», который открывается соответствующей кнопкой, можно выбрать из всего списка только необходимые для слияния записи.







При вставке полей мне кажется удобным подсветить все поля серым цветом, кликнув по кнопке «Выделить поля слияния». В противном случае, если таких полей много, то их можно потерять в тексте.

И так, шаблон готов.

Генерация писем

Последний этап — генерация писем. В OpenOffice для этого в меню «Инструменты» выбираем «Mail Merge Wizard...» и проходим все предлагаемые шаги по объединению нашего шаблона с базой данных.





В диалоговом окне мы видем, что из предложенных 8 пунктов нам некоторые пункты выполнять не придеться. Так документ мы уже создали и редактировать его нам не надо, блок адреса мы тоже уже вставили. Но давайте по-порядку.

Сначала выбираем, что создаем письма на основе текущего документа и жмем «Далее» внизу окна. Вторым пунктом выбираем будет ли у нас это бумажное письмо или e-mail. Для того, чтобы письмо можно было сохранить в файл следует выбрать первое. Жмем «Далее». Третим пунктом нам предлагают создать блок адреса, но поскольку мы его создали руками, то снимаем все галочки и переходим к следующему шагу. Здесь нам предлагают вставить обращение, но оно у нас тоже уже есть, поэтому жмем «Далее». Шестым пунктом можно отредактировать документ, посмотреть на документ со вставленными из базы данных полями и, если надо, какие-то поля исключить.



На шаге 7 предлагается отредактировать каждый из созданных в результате соединения шаблона с базой данных файлов. И наконец на последнем, 8 шаге, можно выбрать что сделать с полученными документам. Можно сохранить, распечатать или отправить по e-mail. При этом можно сохранять все документы в один файл, или каждый документ отдельно.

В MS Word процесс слияния заканчивается нажатием кнопки «Найти и объединить».



Из выпадающего меню очевидно, что все письма можно напечатать и послать через e-mail, но не очевидно, что все их можно сохранить в файл. Для сохранения надо выбрать первы пункт - «Изменить отдельные документы». При этом откроется новый документ, в котором каждое новое письмо будет располагаться с новой странице, а тут уже этот файл можно и сохранить.

Заключение

И так, в этом уроке Вы узнали как используя инструмент слияния создавать документы на основе шаблона. Давайте кратко запишем последовательность действий:

  1. Необходимо в табличном процессоре создать базу данных, из которой будут браться данные для заполнения полей.
  2. Необходимо создать шаблон письма.
  3. Произвести слияние и сохранить результат.

A , фамилии в столбце B и профессии в столбце C .

2. Создайте word документ (.doc или.docx)


{A} , {B} и {C} .

{A} , {B} и {C} {A} - именем, {B} - фамилией, {C} - профессией.

Settings программы.

3. Выберите пути для файлов и папок


Select

4. Задайте листы и строки нужных данных


Excel file data sheets

Excel file data rows Excel file data sheets

1 .

Если вы хотите чтобы в формировании документа участвовали все листы и/или строки вашего excel-файла с данными - нажмите справа на соответствующую кнопку с надпипсью Numbers (ее надпись при этом сменится на All ).

5. Задайте шаблон имен новых word файлов


Задайте шаблон имен новых word-файлов:

New word files names template - это шаблон для имен новых генерируемых программой документов (word-файлов). Здесь шаблон имен содержит имена столбцов excel-файла, обрамленные фигурными скобками: {A} и {B} . При формировании нового документа программа заменит все {A} и {B} соответствующими значениями ячеек из excel-файла - это и будет именем нового документа (word-файла).

Вы можете задать свои обрамляющие символы на вкладке Settings программы.

6. Нажмите "Generate"


Нажмите кнопку Generate и на экране появится прогресс выполнения. Документов (word-файлов) будет создано ровно столько, сколько строк excel-файла участвует в формировании.

7. Всё


Все документы (word-файлы) созданы и лежат в папке, указанной в Folder to save the new word files . Всё:)

Exwog - генератор отчетов из Excel в Word по шаблону

Бесплатный генератор файлов Word по шаблону (файлу Word) на основании данных Excel файла

Работает в Mac OS, Windows и Linux

Позволяет задавать имена новых генерируемых word файлов

Позволяет задавать листы и строки нужных данных

Позволяет задавать обрамляющие символы для имен столбцов Excel

Прост в использовании

Храните ваши данные в Excel формате (.xls и.xlsx) и генерируйте файлы формата Word (.doc и.docx) в несколько кликов:)


Как это работает?

Взгляните на ваш excel файл


В данном примере excel-файл содержит информацию о клиентах. Каждая строка соответствует определенному клиенту. Имена расположены в столбце A , фамилии в столбце B и профессии в столбце C .

Кликните для просмотра

Создайте word документ (.doc или.docx)


Кликните для просмотра

Создайте "шаблон" (word-файл) для формирования новых документов (word-файлов). Здесь текст "шаблона" содержит имена столбцов excel-файла, обрамленные фигурными скобками: {A} , {B} и {C} .

Программа будет генерировать новые документы по "шаблону" заменяя все {A} , {B} и {C} соответствующими значениями ячеек из excel-файла: {A} - именем, {B} - фамилией, {C} - профессией.

Также вы можете задать свои обрамляющие символы на вкладке Settings программы.

Выберите пути для файлов и папок


Выберите пути для файлов и папок (кнопки с надписью Select ). В программе вы задаете следующие пути:

Excel file with data (*.xls, *.xlsx) - это путь к вашему excel-файлу с данными (информация о клиентах);

Word template file (*.doc, *.docx) - это путь к вашему "шаблону" (word-файлу созданному на предыдущем шаге);

Folder to save the new word files - это путь к папке в которую программа будет сохранять новые сгенерированные документы.

Кликните для просмотра

Задайте листы и строки нужных данных


Кликните для просмотра

Задайте номера листов и строк вашего excel-файла с данными (информация о клиентах) по которым требуется сформировать документы:

Excel file data sheets - номера листов вашего excel-файла которые будут участвовать в формировании новых документов;

Excel file data rows - номера строк листов (листов, указанных в Excel file data sheets ) вашего excel-файла которые будут участвовать в формировании новых документов. На основании данных каждой указанной строки будет создан отдельный документ (word-файл).

Нумерация листов и строк в программе начинается с 1 .

Мы живем в мире, где PHP разработчикам приходится время от времени взаимодействовать с операционной системой Windows. WMI (Windows Management Interface, Интерфейс управления Windows) - один из таких примеров - взаимодействие с Microsoft Office.

В данной статье мы рассмотрим простую интеграцию между Word и PHP: генерацию документа Microsoft Word на основе полей ввода в HTML-форме с помощью PHP (и его расширения Interop).

Подготовительные шаги

Первым делом убедимся, что у нас настроено базовое окружение WAMP. Так как Interop присутствует только в Windows, то нам необходимо, чтобы наш сервер Apache и инсталляция PHP были развернуты на Windows машине. В этом качестве я использую EasyPHP 14.1 , который крайне прост в установке и настройке.

Следующим делом необходимо установить Microsoft Office. Версия не очень важна. Я использую Microsoft Office 2013 Pro, но любая версия Office старше 2007 должна подойти.

Также необходимо убедиться, что у нас установлены библиотеки для разработки приложения Interop (PIA, Primary Interop Assemblies, Основные Сборки Interop). Узнать это можно открыв Проводник Windows, и перейдя в директорию \assembly , и там мы должны увидеть набор установленных сборок:

Здесь можно увидеть элемент Microsoft.Office.Interop.Word (подчеркнут на скриншоте). Это будет та сборка, которую мы будем использовать в нашей демонстрации. Пожалуйста, обратите особое внимание на поля “Assembly name (Имя сборки)”, “Version (Версия)” и “Public key token (Токен публичного ключа)”. Их мы скоро будем использовать в нашем PHP скрипте.

В этой директории также присутствуют и другие сборки (включая и все семейство Office), доступные для использования в своих программах (не только для PHP, но также и для VB.net, C#, и т.д.).

Если список сборок не включает весь пакет Microsoft.Office.Interop , то нам нужно либо переустановить Office, добавив PIA, или вручную загрузить пакет с сайта Microsoft и установить его. Для более детальных инструкций обратитесь к этой странице на MSDN .

Замечание : к загрузке и установке доступен только дистрибутив PIA Microsoft Office 2010. Версия сборок в этом пакете 14.0.0, а 15 версия поставляется только с Office 2013.

И, наконец, необходимо включить расширение php_com_dotnet.dll в php.ini и перезапустить сервер.

Теперь можно перейти к программированию.

HTML форма

Так как основная часть данного примера ложится на серверную сторону, мы создадим простую страничку с формой, которая будет выглядеть следующим образом:

У нас есть текстовое поле для имени, группа переключателей для пола, слайдер для возраста, и область ввода текста для ввода сообщения, а также небезызвестная кнопка “Отправить”.

Сохраните этот файл как “index.html” в директории виртуального хоста, чтобы до него можно было добраться по адресу типа http://test/test/interop .

Серверная часть

Файл-обработчик на серверной стороне - это основная цель нашего разговора. Для начала я приведу полный код этого файла, а потом объясню его шаг за шагом.

visible = true; $fn = __DIR__ . "\\template.docx"; $d = $w->Documents->Open($fn); echo "Документ открыт.


"; $flds = $d->Fields; $count = $flds->Count; echo "В документе $count полей.
"; echo "
    "; $mapping = setupfields(); foreach ($flds as $index => $f) { $f->Select(); $key = $mapping[$index]; $value = $inputs[$key]; if ($key == "gender") { if ($value == "m") $value = "Mr."; else $value = "Ms."; } if($key=="printdate") $value= date ("Y-m-d H:i:s"); $w->Selection->TypeText($value); echo "
  • Назначаю полю $index: $key значение $value
  • "; } echo "
"; echo "Обработка завершена!

"; echo "Печатаю, пожалуйста, подождите...
"; $d->PrintOut(); sleep(3); echo "Готово!"; $w->Quit(false); $w=null; function setupfields() { $mapping = array(); $mapping = "gender"; $mapping = "name"; $mapping = "age"; $mapping = "msg"; $mapping = "printdate"; return $mapping; }

После того, как мы записали в переменную $inputs значения, полученные из формы, а также создали пустой элемент с ключом printdate (зачем мы это сделали - обсудим позже), мы переходим к четырем очень важным строкам:

$assembly = "Microsoft.Office.Interop.Word, Version=15.0.0.0, Culture=neutral, PublicKeyToken=71e9bce111e9429c"; $class = "Microsoft.Office.Interop.Word.ApplicationClass"; $w = new DOTNET($assembly, $class); $w->visible = true;

Манипулятор COM в PHP требует создания экземпляра класса в рамках “сборки”. В нашем случае мы работаем с Word. Если взглянуть на первый скриншот, то можно записать полную сигнатуру сборки для Word:

  • “Name”, “Version”, “Public Key Token” - все это берется из информации, которую можно просмотреть в “c:\Windows\assembly“ .
  • “Culture” всегда neutrual

Класс, на который мы хотим ссылаться, всегда называется “имя.сборки”+ “ .ApplicationClass “.

Установив два этих параметра мы сможем получить объект для работы с Word.

Этот объект может оставаться в фоне, или мы можем перевести его в рабочий режим установкой атрибута visible в true .

Следующим шагом открываем документ, требующий обработки, и записываем экземпляр “документа” в переменную $d .

Чтобы создать в документе содержимое, основанное на данных с формы, можно пойти несколькими путями.

Самым неправильным было бы жестко прописать содержимое документа в PHP, а потом вывести его в документ Word. Я настоятельно рекомендую этого не делать по следующим причинам:

  1. Вы теряете гибкость. Любые изменения в выходном файле потребуют изменения кода PHP.
  2. Это нарушает разделение управления и вида
  3. Применение стилей к содержимому документа (выравнивание, шрифты, стили, и т.д.) в скрипте сильно увеличит количество строк кода. Программное изменение стилей чересчур громоздко.

Другим вариантом будет использование поиска и замены. У PHP есть хорошие встроенные средства для этого. Мы можем создать документ Word, в котором разместим метки со специальными разделителями, которые в последствии будут заменены. Например, мы можем создать документ, который будет содержать следующий фрагмент:

а с помощью PHP мы легко можем заменить его на содержимое поля “Имя”, полученное с формы.

Это просто, и избавляет нас ото всех неприятных последствий, с которыми мы сталкиваемся в первом способе. Нам всего лишь нужно определиться с правильным разделителем, и в этом случае мы, получается, используем шаблон.

Я рекомендую третий способ, и он основывается на более глубоком знании Word. В качестве заполнителей мы будем использовать поля, а с помощью PHP кода будем непосредственно обновлять значения в полях соответствующими значениями.

Этот подход гибкий, быстрый, и согласуется с лучшими практиками работы с Word. С его помощью также можно избежать полнотекстового поиска в документе, что хорошо сказывается на производительности. Замечу, что у этого решения также есть недостатки.

Word с самого начала не поддерживал именные индексы для полей. Даже если мы и указали имена для создаваемых полей - нам все равно необходимо пользоваться числовыми идентификаторами этих полей. Это также объясняет, зачем нам нужно использовать отдельную функцию (setupfields) для того, чтобы задать соответствие индекса поля и имени поля из формы.

В этом демонстрационном уроке мы будем использовать документ с 5 полями MERGEFIELD . Шаблонный документ разместим там же, где и наш скрипт-обработчик.

Прошу заметить, что поле printdate не имеет соответствующего поля на форме. Вот зачем мы добавили пустой элемент printdate в массив $inputs . Без этого скрипт все же будет запускаться и работать, но PHP будет выдавать предупреждение, что индекс printdate отсутствует в массиве $inputs .

После замены полей новыми значениями мы отпечатаем документ с помощью

$d->PrintOut();

Метод PrintOut принимает несколько необязательных параметров, и мы используем самую простую его форму. Так будет отпечатана одна копия документа на принтере по умолчанию, который присоединен к Windows-машине.

Также можно вызвать PrintPreview , чтобы взглянуть на получившийся результат, прежде чем его отпечатать. В полностью автоматическом окружении мы, конечно же, будем использовать метод PrintOut .

Необходимо подождать некоторое время, прежде чем завершить работу с приложением Word, так нужно время на то чтобы поставить в очередь задание на печать. Без delay(3) метод $w->Quit выполняется незамедлительно, и задание не ставится в очередь.

Наконец, мы вызываем $w->Quit(false) , что закрывает приложение Word, которое было вызвано нашим скриптом. Единственным параметром, передаваемым в метод, является указание сохранить файл перед выходом. Мы сделали правки в документе, но мы не хотим их сохранять, так как нам нужен чистый шаблон для последующей работы.

После того, как мы закончили с кодом, можем загрузить нашу страницу с формой, забить некоторые значения, и отправить её. Нижеприведенные изображения показывают результат работы скрипта, а также обновленный документ Word:

Улучшение скорости обработки и немного подробнее о PIA

PHP - слабо типизированный язык. Объект COM типа Object . Во время написания скрипта у нас нет возможности получить описание объекта, будь оно приложением Word, документом или полем. Мы не знаем, какие свойства есть у этого объекта, или какие он поддерживает методы.

Это сильно замедлит скорость разработки. Чтобы ускорить разработку, я бы рекомендовал писать функции сначала на C#, а после переводить код в PHP. Я могу рекомендовать бесплатную IDE для разработки на C# под названием “#develop”. Найти ее можно . Я предпочитаю ее Visual Studio, так как #develop меньше, проще и быстрее.

Миграция C# кода в PHP не так страшна, как кажется. Давайте я покажу вам пару строк на C#:

Word.Application w=new Word.Application(); w.Visible=true; String path=Application.StartupPath+"\\template.docx"; Word.Document d=w.Documents.Open(path) as Word.Document; Word.Fields flds=d.Fields; int len=flds.Count; foreach (Word.Field f in flds) { f.Select(); int i=f.Index; w.Selection.TypeText("..."); }

Можно заметить, что код на C# очень похож на код PHP, который я показывал ранее. C# - строго типизированный язык, так что в этом примере можно заметить несколько операторов приведения типов, а также переменным необходимо указывать тип.

С указанием типа переменной, можно наслаждаться более понятным кодом и автодополнением, и скорость разработки существенно повышается.

Другой способ повысить скорость разработки на PHP - вызывать макрос в Word. Мы проводим ту же последовательность действий, а после сохраняем ее как макрос. Макрос написан на Visual Basic, который также просто перевести в PHP.

И, что самое важное - документация по Office PIA от Microsoft , особенно документация по пространствам имен каждого приложения Office является самым детальным справочным материалом. Наиболее используемые три приложения:

  • Excel 2013: http://msdn.microsoft.com/en-us/library/microsoft.office.interop.excel(v=office.15).aspx
  • Word 2013: http://msdn.microsoft.com/en-us/library/microsoft.office.interop.word(v=office.15).aspx
  • PowerPoint 2013: http://msdn.microsoft.com/en-us/library/microsoft.office.interop.powerpoint(v=office.15).aspx

Заключение

В этой статье мы показали, как заполнить данными документ Word с помощью библиотек PHP COM и возможностями взаимодействия Microsoft Office.

Windows и Office широко используются в повседневной жизни. Знать силу Office/Window и PHP будет полезно каждому PHP и Windows разработчику.

С помощью расширения PHP COM вам открывается дверь к использованию этой комбинации.

Понравилось? Лайкни нас на Facebook