Лекция №4
Занятие 4. Обработка
текстовой информации
1.
Обработка
текстовой информации
2.
Функции и возможности
текстовых редакторов.
1. Обработка текстовой информации
Текстовая
информация может возникать из различных источников и иметь различную степень
сложности по форме представления. В зависимости от формы представления для
обработки текстовых сообщений используют разнообразные информационные
технологии. Чаще всего в качестве инструментального средства обработки текстовой
электронной информации применяют текстовые редакторы или процессоры. Они
представляют программный продукт, обеспечивающий пользователя специальными
средствами, предназначенными для создания, обработки и хранения текстовой
информации. Текстовые редакторы и процессоры используются для составления,
редактирования и обработки различных видов информации. Отличие текстовых
редакторов от процессоров заключается в том, что редакторы, как правило,
предназначены для работы только с текстами, а процессоры позволяют использовать
и другие виды информации.
Редакторы,
предназначенные для подготовки текстов условно можно разделить на обычные
(подготовка писем и других простых документов) и сложные (оформление документов
с разными шрифтами, включающие графики, рисунки и др.). Редакторы, используемые
для автоматизированной работы с текстом, можно разделить на несколько типов:
простейшие, интегрированные, гипертекстовые редакторы, распознаватели текстов,
редакторы научных текстов, издательские системы.
В простейших
редакторах-форматерах (например, “Блокнот”) для внутреннего представления текста
дополнительные коды не используются, тексты же обычно формируются на основе
знаков кодовой таблицы ASCII.
Обработка текста
один из важнейших моментов в офисной работе. В современных условиях обработка
текста усложняется, как правило, современные текстовые документы содержат
графику, таблицы, вставки из баз данных и многое
другое.
Средства
обработки текста на ПК:
• текстовые
редакторы
• текстовые
процессоры
Под сложным составным
документом будем понимать документ, включающий объекты разных типов,
создаваемых с помощью других приложении (электронные таблицы, рисунки, базы
данных, другие документы). Объекты создаются в специально предназначенных
приложениях и потом переносятся в документ как объект
редактора.
Классификация элементов текста при его обработке на
ПК.
Документ
– соотносится с
одним рабочим файлом, но данный файл может быть связан с другими файлами
(например, с полями базы данных либо с фрагментами электронной
таблицы).
Обмен объектами
между приложениями может осуществляться как:
• внедрение
объекта – при изменении документа – источника – в документе –
приемнике изменений не происходит;
• связывание
объектов - наоборот. При этом связь может осуществляться автоматически и
по запросу.
Раздел
– группа страниц –
для организации глав. К страницам одного раздела применяется единое
оформление.
Страница
– элемент вида
документа. Различают
• физическую
страницу (размер бумаги)
•логическую
страницу – если из физической вычесть границы – на логической странице
располагается основное содержание страницы.
На странице
различают:
• основной
текст;
• верхний и
нижний колонтитулы;
•
сноски.
Основной текст
страницы — это
строки и абзацы, таблицы и рисунки. Некоторые из абзацев могут быть заголовками;
рисунки могут иметь подписи.
Колонтитул
размещается в
верхней или нижней части страницы и содержит некоторую информацию, которая
как-то идентифицирует данный документ (номер раздела, название документа или
раздела, дату, марку фирмы и т. п.). В колонтитул входит номер страницы.
Колонтитулы автоматически воспроизводятся на каждой странице
документа.
Сноска
— это примечание к
тексту, которое может находиться либо в нижней части страницы, либо в конце
документа.
Абзац
- фрагмент текста,
заканчивающийся жестким разрывом строки.
Различие между
жестким и мягкими и разрывами строк – жесткий устанавливается
пользователем, мягкий – текстовым процессором.
Абзац
характеризуется
следующими основными параметрами:
• расстояния
слева и справа до полей документа
• отступ от
предыдущего и последующего абзацев, причем этот отступ не распространяется на
начало и конец страницы.
• Выравнивание
строк абзаца
• Расстояние
между строками абзаца
• Положение
первой строки
• Правила
расположения абзаца на страницах.
• Стиль абзаца –
правила его оформления (форматирования) и тип абзаца – основной текст и
заголовки.
Слово
– фрагмент
произвольного текста между служебными символами – то есть знаками препинания и
пробелами.
Символ
– минимальная
текстовая единица. Основная ее характеристика – шрифт. Основные
характеристики шрифта:
• тип – точечный
либо векторный – True Type, точечный создается из набора черно-белых точек в
некотором прямоугольнике, а векторный – описывается как сложная геометрическая
фигура
• наименование –
семейство шрифтов, его стиль, имя
•
начертание
• размер – в
кеглях – один кегль – порядка
•
цвет
• дополнительные возможности – только для векторных шрифтов – наклон, подчеркивание, индексы и т.д.
2. Функции и возможности текстовых редакторов.
Текстовые
процессоры представляют систему подготовки текстов (Word Processor). Наибольшей
популярностью среди них пользуется программа MS Word. Технология обработки
текстовой информации с помощью таких программ обычно включает следующие этапы:
1) создание файла
для хранения текстовой информации;
2) ввод и (или)
копирование текстовой информации в компьютер;
3) сохранение
текста, представленного в электронной форме;
4) открытие
файла, хранящего текстовую информацию;
5) редактирование
электронной текстовой информации;
6) форматирование
текста, хранящегося в электронной форме;
7) создание
текстовых файлов на основе встроенных в текстовый редактор стилей оформления;
8) автоматическое
формирование оглавления к тексту и алфавитного справочника;
9) автоматическая
проверка орфографии и грамматики;
10) встраивание в
текст различных элементов и объектов;
11) объединение
документов;
12) печать
текста.
К основным
операциям редактирования относят: добавление; удаление; перемещение; копирование
фрагмента текста, а также поиска и контекстной замены. Если создаваемый текст
представляет многостраничный документ, то можно применять форматирование страниц
или разделов. При этом в тексте появятся такие структурные элементы, как:
закладки, сноски, перекрестные ссылки и колонтитулы.
Большинство
текстовых процессоров поддерживает концепцию составного документа – контейнера,
включающего различные объекты. Она позволяет вставлять в текст документа
рисунки, таблицы, графические изображения, подготовленные в других программных
средах. Используемая при этом технология связи и внедрения объектов
называется OLE (Object Linking and Embedding – связь и внедрение
объектов).
Для автоматизации
выполнения часто повторяемых действий в текстовых процессорах используют
макрокоманды.
Перенос текстов
из одного текстового редактора в другой осуществляется
программой-конвертером. Она создаёт выходной файл в соответствующем
формате. Обычно программы текстовой обработки имеют встроенные модули
конвертирования популярных файловых форматов.