Технология
<<  Электрохимические и Электрофизические методы обработки 5.5. Телекоммуникационные технологии  >>
...Вот что он описывает:
...Вот что он описывает:
Применения XML
Применения XML
Картинки из презентации «Автоматическая обработка естественного языка» к уроку технологии на тему «Технология»

Автор: NSFGrant. Чтобы познакомиться с картинкой полного размера, нажмите на её эскиз. Чтобы можно было использовать все картинки для урока технологии, скачайте бесплатно презентацию «Автоматическая обработка естественного языка.ppt» со всеми картинками в zip-архиве размером 295 КБ.

Автоматическая обработка естественного языка

содержание презентации «Автоматическая обработка естественного языка.ppt»
Сл Текст Сл Текст
1Автоматическая обработка естественного 18"books-1.dtd">
языка. I. Обработка письменного текста. <booklist> <book>
2XML — язык разметки структурированных <author>А.А. Зализняк</author>
(в т. Ч. Лингвистических) данных. А также <title>Древнерусские
XSL — язык для преобразования данных. энклитики</title>
3XML, XSL, XYZ... Программа Что такое <city>Москва</city>
XML Назначение. Синтаксис Определение типа <year>2008</year>
документов (DTD) Язык навигации по </book> <book>
документу (XPath) Пространства имён <author>J.K. Rowling</author>
(Namespaces) Преобразования документов <title>Harry Potter and the Secret
(XSL). Chamber</title> <city>New
4Где прочитать? York</city>
http://en.wikipedia.org/wiki/Xml <year>2005</year>
http://www.w3.org/XML/ — стандарты </book> </booklist>
http://w3schools.com — простые пособия и 19Синтаксис XML. Основные понятия:
тесты http://www.zvon.org/ — пособия, документ (? файл) элемент <KING>
статьи и др. (на многих языках) <POSITION COLUMN="G"
http://www.raleigh.ru/tutorials/ — русские ROW="1"/> </KING>
переводы нескольких пособий со ZVON.org. атрибут .. COLUMN="G" ..
Что такое XML. 20Синтаксис XML. Каждый документ должен
5XML = eXtensible Markup Language. Что иметь ровно один корневой элемент У
такое XML. каждого открывающего тэга должен быть
6Что такое XML? eXtensible Markup закрывающий Тэги должны быть правильно
Language Extensible — расширяемый. Каждый вложены друг в друга Значения атрибутов
пользователь приспосабливает его для своей обязательно берутся в кавычки Регистр
задачи. XML внешне похож на HTML Это тоже символов в именах важен!
язык разметки (HyperText Markup Language) 21Синтаксис XML. Имя элемента может:
Синтаксис обоих происходит от SGML содержать буквы, цифры, подчеркивание,
(Standard Generalized Markup Language). двоеточие или точку начинаться с только с
7Пример HTML. <html> <head> буквы или подчеркивания кроме букв “xml”
<title>Title of this (в любом регистре) Значения атрибутов
page</title> </head> могут заключаться в (двойные прямые)
<body> <p>This is my first кавычки либо апострофы. Одни могут
homepage.<br> <b>This text is использоваться внутри других:
bold.</b> And this is <b>bold <xsl:param name="file"
<i>and italic</b>, select="'books.xml'"/>
wow</i>! </p> </body> <xsl:param name='file'
</html> select='"books.xml"'/>
81page.htm. ...Вот что из этого 22Специальные символы. Entities В тексте
получается: элемента не могут использоваться
9Пример XML. <?xml специальные символы разметки: < и
version="1.0" &. Они должны заменяться на &lt; и
encoding="ISO-8859-1"?> &amp;. Также определены: &gt; >
<CHESSBOARD> <WHITEPIECES> &quot; " &apos; ' CDATA
<KING><POSITION sections Если необходимо вставить в
COLUMN="G" документ фрагмент текста, содержащий много
ROW="1"/></KING> спецсимволов, используется конструкция
<BISHOP><POSITION CDATA (Character Data). Парсер игнорирует
COLUMN="D" всё до символов ]]>: <example>
ROW="6"/></BISHOP> <![CDATA[
<ROOK><POSITION <%aaa%>bb&cc<<dd ]]>
COLUMN="E" </example>
ROW="1"/></ROOK> 23Правильность документов. XML-документ,
<PAWN><POSITION отвечающий требованиям синтаксиса,
COLUMN="A" называется правильно построенным
ROW="4"/></PAWN> (well-formed). Правильно построенные
<PAWN><POSITION документы успешно обрабатываются парсером.
COLUMN="B" Однако, эта характеристика ничего не
ROW="3"/></PAWN> … говорит о содержании документа —
</WHITEPIECES> <BLACKPIECES> осмысленно ли оно? Знаем ли мы, что
<KING><POSITION означают его элементы и атрибуты?
COLUMN="B" 24Определение типа (DTD). DTD — Document
ROW="6"/></KING> Type Definition Задаёт возможную структуру
<QUEEN><POSITION для некоторого типа XML-документов (т. е.
COLUMN="A" задаёт один возможный язык) как могут
ROW="7"/></QUEEN> называться элементы как они могут друг в
<PAWN><POSITION друга вкладываться какие у каждого
COLUMN="A" элемента могут быть атрибуты Документ,
ROW="5"/></PAWN> отвечающий некоторому DTD, называется
<PAWN><POSITION действительным (valid). Этот вид
COLUMN="D" правильности проверяется валидатором.
ROW="4"/></PAWN> 25Определение типа (DTD). <?xml
</BLACKPIECES> </CHESSBOARD> version="1.0"
10...Вот что он описывает: encoding="UTF-8"?>
11Чем XML отличается от HTML? Почти <!ELEMENT booklist (book*) >
всем. Главное — назначением HTML <!ELEMENT book (author, title, city,
используется для отображения данных в year)> <!ELEMENT author
браузере. В нем смешаны элементы (#PCDATA)> <!ELEMENT title
содержания и оформления. XML используется (#PCDATA)> <!ELEMENT city
для хранения данных и описания их (#PCDATA)> <!ELEMENT year
структуры. Он задаёт только содержание (#PCDATA)>
документа. 26Определение типа (DTD). Содержимое
12Чем XML отличается от HTML? Гибкостью элементов <!ELEMENT book (author,
Тэги HTML и их значение жёстко заданы в title, city, year)> author, title —
спецификации. В спецификации XML последовательность author|title — выбор
фиксирован только синтаксис. Тэги XML и их (или — или) EMPTY — пустой элемент ANY —
значение задаются пользователем. любая комбинация допустимых типов #PCDATA
Фактически, XML — это не один язык, а — текстовое содержание (Parsed Character
семейство языков, потому что каждый Data: оно анализируется парсером, так как
пользователь, придумывая свои тэги, задаёт потенциально может содержать вложенные
свой язык. элементы). Список дочерних элементов.
13Чем XML отличается от HTML? Немного — 27Определение типа (DTD). Количество
синтаксисом Требования к синтаксису более повторений элемента <!ELEMENT booklist
строгие, что делает структуру документа (book*) > book — 1, обязательный book?
более наглядной и облегчает автоматизацию — 1, необязательный (0 или 1) book+ — 1
его проверки и обработки. или больше (сколько угодно) book* — 0 или
14Применения XML. Обработка больше (сколько угодно) Добавим в book
структурированных данных разработка необязательный элемент publisher?
веб-сайтов, системы управления содержанием (издательство).
(CMS); трансляции новостей (RSS) Google 28Определение типа (DTD). Добавляем
XML Sitemaps базы данных (Native XML DBMS атрибуты В документ: <book
и экспорт-импорт из других БД) создание и lang="rus"
обработка метаданных (см. тж. Semantic bookid="AAZ01">
Web) Dublin Core; OLAC, IMDI ведение <author>А.А. Зализняк</author>
технической документации (формат DocBook и … </book> В DTD: <!ATTLIST book
др.) обработка текста и разметка lang CDATA #IMPLIED bookid ID
мультимедиа OpenOffice.org 2.0+, MS Office #REQUIRED> Имя атрибута.
2007+ ELAN, Transcriber,… 29Определение типа (DTD). Типы атрибутов
15Применения XML. Обработка <!ATTLIST book lang CDATA #IMPLIED
структурированных данных Semantic Web — bookid ID #REQUIRED genre
«надстройка» над Web’ом, с помощью (fiction|nonfiction) #IMPLIED> (..|..)
метаданных описывающая свойства и — одно из перечисленных значений CDATA —
содержание (сетевых) ресурсов и логические простой текст (Character Data) ID —
связи между ними. Цель — осмысленная идентификатор (значение не может
машинная обработка информации, логические повторяться) IDREF — ссылка на
выводы и т. д. Semantic Web основан на идентификатор другого элемента …и
модели RDF (Resource Description некоторые другие.
Framework), где все отношения описываются 30Определение типа (DTD). Значения
тройками «субъект-отношение-объект», а все атрибутов по умолчанию <!ATTLIST book
элементы троек являются идентификаторами lang CDATA "eng" bookid ID
ресурсов (URI). Один из двух основных #REQUIRED genre (fiction|nonfiction)
форматов записи RDF — RDF-XML. #IMPLIED> либо значение по умолчанию,
16Применения XML. Обмен данными между либо: #IMPLIED — атрибут необязателен
приложениями Программы, использующие #REQUIRED — атрибут обязателен #FIXED
разные внутренние форматы, могут успешно значение — значение неизменно.
обмениваться данными в XML. промышленная 31DTD и другие схемы. DTD — только один
разработка и производство электронная из видов схем для описания структуры
коммерция (business2business, XML-документов. Может встраиваться в
business2consumer) Amazon Web Services описываемый документ. Компактные размеры.
лингвистика: Fieldworks (БД) => XML Поддерживается большинством парсеров.
=> ELAN Обмен данными с портативными Синтаксис отличен от XML. Ограниченные
устройствами Некоторые сферы применения возможности. Не поддерживает пространства
XML Scalable Vector Graphics (SVG) имён. Не поддерживает типы данных.
(векторная графика); SMIL (Synchronized 32DTD и другие схемы. В серьезных
Multimedia Integration Language); VoiceXML проектах чаще применяются более сложные и
(команды программ речевого интерфейса); выразительные средства, в особенности два:
MusicXML (музыкальные партитуры); ebXML XML Schema Синтаксис XML. Развернутая
(electronic business XML); Chemical Markup система типов данных, но не расширяемая.
Languge; Structured Product Labeling Громоздкая запись. Легко описать
(фармакология);… фиксированное число (диапазон) повторений
17Рекомендуемые XML-редакторы. элемента/группы. Relax NG Два варианта
http://www.firstobject.com foxe — синтаксиса: XML и компактный, полностью
firstobject XML editor (.exe в архиве переводимые друг в друга. Редуцированная
.zip, не требует установки) Очень простой система типов данных, но с возможностями
и быстрый редактор. Поддерживает Юникод. расширения. Допускает группы с
Имеется валидатор. нефиксированным порядком элементов.
http://www.freexmleditor.com/ Exchanger Атрибуты могут использоваться при
XML Lite V3.2 (требует установки, моделировании структуры документа наравне
понадобится для выполнения заданий по XSL) с элементами. Например, наличие дочернего
Полнофункциональный редактор XML/XSL с элемента может зависеть от определенного
отладчиком для XSL-трансформаций. Увы, значения атрибута.
давно не обновлялся. 33Продолжение — на w3schools.com (и не
18Простой XML-документ. <?xml только). Тест на основные понятия
version="1.0" http://w3schools.com/xml/xml_quiz.asp
encoding="UTF-8"?> Учебники по XML и другим технологиям
<!DOCTYPE booklist SYSTEM (XPath, XSLT и др.).
Автоматическая обработка естественного языка.ppt
http://900igr.net/kartinka/tekhnologija/avtomaticheskaja-obrabotka-estestvennogo-jazyka-82586.html
cсылка на страницу

Автоматическая обработка естественного языка

другие презентации на тему «Автоматическая обработка естественного языка»

«Эволюция и естественный отбор» - При стабилизирующем отборе преимущество в размножении получают особи со средним выражением признака. 4. Эволюция не всегда идёт от простого к сложному. Макроэволюция связана с эволюционными преобразованиями за длительный исторический период, которые приводят к возникновению надвидовых форм организации живого.

«Музей естественной истории» - По стенами вырезаны растения и животные. И проследить развитие жизни до наших дней. И минералах. Музей довольно большой. На крыше установлены фигурки с орлами и львами, Диплодок. Приматах, Ископаемых рыб, А также разным млекопитающим. В музее также есть много туалетов, ресторан, кафе и несколько сувенирных магазинов.

«Обработка информации в компьютере» - Мультимедиа multi media. Установить запись на начало (кнопка НАЗАД). ПРАКТИЧЕСКАЯ РАБОТА Обработка звука («Тайная шифровка») Открыть программу «ЗВУКОЗАПИСЬ» (ПУСК-ПРОГРАММЫ-СТАНДАРТНЫЕ-РАЗВЛЕЧЕНИЯ-ЗВУКОЗАПИСЬ). С какими видами информации может работать современный компьютер? Изменить скорость (Эффекты – увеличить или уменьшить скорость) Произвести разворот записи (Эффекты-обратить) Прослушать результат.

«Технология обработки бумаги» - Совершенно неважно, чтобы мозаика состояла из квадратиков. Бумага и история развития бумажных ремесел. "Поделки. Когда гуашь подсохнет, распишите заготовку по своему желанию. Можно нарезать кусочки произвольной геометрической формы: кружочки, треугольнички, ромбики. Бумага практически моментально превратится в кашицу.

«Цифровая обработка сигналов» - Аппаратная и программная реализация. sin. Вводные сведения по комплексной арифметике. Направления развития ЦОС. Типовая блок-схема устройства ЦОС. Основные разделы ЦОС. Информационные источники. План лекции. cos. arctan. Конспект лекций. Цифровая обработка сигналов: лекция 1. У.М. Сиберт. Предмет курса.

«Обработка почвы» - 4. Прикатывание - обеспеченность выравнивание и уплотнения почвы. Культиваторы используют для сплошной и междурядной обработки. Каждым приемом обработки выполняют одну или несколько технологических операций. Технологические процессы при обработке почвы: Основы обработки почвы. Уплотнение почвы позволяет добиться равномерной заделки семян.

Технология

32 презентации о технологии
Урок

Технология

35 тем
Картинки
900igr.net > Презентации по технологии > Технология > Автоматическая обработка естественного языка