Text DatenbankenOracle8i interMedia Text Version-30.10..ppt
《Text DatenbankenOracle8i interMedia Text Version-30.10..ppt》由会员分享,可在线阅读,更多相关《Text DatenbankenOracle8i interMedia Text Version-30.10..ppt(71页珍藏版)》请在麦多课文档分享上搜索。
1、Text DatenbankenOracle8i interMedia Text Version:30.10.2000Autoren:Bent GromannNiels BauerZusammenfassung:Dieses Dokument befat sich mit Volltextdatenbanken und stellt diese anhand Oracle8i interMedia Text vor. Verfahren und Funktionsweisen werden kurz in Form von erluternden Beispielen gezeigt.Beso
2、nderes Augenmerk liegt auf dem Laden von Texten, deren Indizierung, dem stellen von Anfragen sowie die Prsentation von Ergebnisdokumenten.Ein Vergleich mit SQL/MM Full Text schliet das Dokument ab.,Oracle8i interMedia Text Einfhrung,1.0 EinfhrungOracle interMedia Text ist Bestandteil von Oracle inte
3、rMedia und wird mit Version 8i der Oracle Datenbank ausgeliefert. Oracle8i interMedia Text erlaubt es unstrukturierte Daten (Texte) zu verwalten, indizieren und danach zu suchen. Die Freitextsuche erlaubt es Dokumente innerhalb und auerhalb der Oracle8i Datenbank zu durchsuchen. Es ermglicht content
4、-based querys, d.h. das finden von Dokumenten oder Texten die ein bestimmtes Wort enthalten.,1.1 Ein kurzes Beispiel create table docs (id number primary key, text varchar2( 80 ) ); insert into docs values ( 1, erstes Dokument ) ; insert into docs values ( 2, zweites Dokument ) ; commit ; create ind
5、ex doc_index on docs ( text ) indextype is ctxsys.context; select id from docs where constains ( text , first ) 0 ;Es werden alle Zeilen , in denen die Text-spalte, das Wort “first” enthlt gefunden. Der Ausdruck “ 0 “ ist notwendig um ein erlaubtes Oracle SQL Kommando zu benutzen, da boolsche Werte
6、im Moment nicht untersttzt werden.,Oracle8i interMedia Text Einfhrung,1.2 Wichtige nderungen im Vergleich mit Oracle ConTex 2.xSmtliche Funktionalitten sind schon im Kernel enthalten und laufen somit nicht mehr als Daemon wie dies in lteren Versionen der Fall war. Dies erhht die Performance und erle
7、ichtert die Entwicklung deutlich. Viele ConText Kommandos nderten sich von PL/SQL zu Standard SQL . Das Query Model wurde vereinfacht und besteht normalerweise nur noch aus single-step-querys Two-step-querys werden in Oracle 8i nicht mehr untersttzt und In-memory-querys werden durch einfache SQL-cur
8、sors ersetzt. Index Statements wechselten von PL/SQL zu normalen SQL,Oracle8i interMedia Text Einfhrung,1.3 System definierte Rollen CTXSYS Rolle Die CTXSYS Rolle ermglicht dem Benutzer das starten des CTXSRV Servers. Weiterhin kann er alle ausfhren aller Ttigkeiten eines CTXAPP Benutzers ausfhren.
9、CTXAPP Rolle Mit der CTXAPP Rolle kann der Benutzer Indexe erstellen, das Textdaten Wrterbuch verwalten sowie Prferenzen einbinden, angelegen und lschen. Das benutzen von Anfragen (Text queries ) ist genauso mglich wie auch die Benutzung der interMedia Text PL/SQL Funktionalitten.,Oracle8i interMedi
10、a Text Einfhrung,1.4 Laden von Dokumenten / gltige DatenformateDie Standardeinstellung erwartet das Dokumente in eine Textfeld geladen werden, aber das einbinden des Dateisystems bzw. das Einbinden von URL s ist mglich.Es gibt verschiedene Varianten zum laden von Daten SQL INSERT Anweisung ctxload e
11、xecutable SQL*Loader DBMS_LOB.LOADFROMFILE() PL/SQL ( Prozedur zum laden von LOBs aus BFILEs )Textfelder knnen verschiedene Datentypen wie VARCHAR2, CLOB, BLOB, CHAR oder BFILE haben. Als Dokumentenformate sind HTML, PDF, Microsoft Word sowie plain Text mglich.,Oracle8i interMedia Text Einfhrung,1.5
12、 Indexe erstellenWenn der Text in eine Textspalte geladen wurde kann damit begonnen werden eine Index zu erstellen. Hier ein kurzes Beispiel:Hier ein Beispiel:create index myindex on docs(text) indextype is ctxsys.context;Beim erstellen von Indexen gilt es die Besonderheiten der verschiedenen Sprach
13、en zu beachtet.,Oracle8i interMedia Text Einfhrung,1.5 Indexe erstellen Generelle Einstellungen fr alle Sprachendie Datentypen NCLOB, DATE und NUMBER knnen nicht indiziert werden Zum indizieren von verschiedenen Dokumenten ist es ntig das der im System vorhandene Inso-Filter richtig eingerichtet wur
14、de. Es wird die im System angegebene Sprache zum indizieren verwendet Die default Stop-List fr die im System angegebene Sprache wird verwendet fuzzy und stemming anfragen werden untersttzt wenn diese fr ihre Sprache vorhanden sind.,Oracle8i interMedia Text Einfhrung,1.5 Indexe erstellen Sprachen spe
15、zifische EinstellungenEnglisch Themen Informationen sind mglich und damit auch ABOUT Anfragen. Diese werden dadurch prziser.Deutsch Case-sensitives IndizierenComposite IndexingAlternate spellingHollndisch Composite IndexingAlternate spellingSchwedisch Alternate spelling,Oracle8i interMedia Text Einf
16、hrung,1.5 Indexe erstellen Sprachen spezifische EinstellungenEine Indexwartung ist nach dem Einfgen,Update oder dem lschen von Stzen notwendig ,dazu wird INDEX ALTER verwendet.Der im Hintergrund laufende ctxsrv server synchronisiert den Index in festen Intervallen automatisch.,Oracle8i interMedia Te
17、xt Einfhrung,1.6 AnfragenEs werden grundstzlich zwei Arten von Anfragen unterschieden, word querys und about-querys. Word-AnfragenEine word-query ist eine von einfachen Hochkommas eingeschlossenen Anfrage, nach einem bestimmten Wort oder einer PhraseSELECT SCORE(1) title from newsWHERE CONTAINS ( te
18、xt , oracle , 1) 1Es knnen AND , OR Operatoren sowie strukturierte Prdikate benutzt werden,Oracle8i interMedia Text Einfhrung,1.6 Anfragen About-AnfragenIn allen Sprachen zhlen ABOUT Anfragen die Anzahl von relevanten Dokumenten welche die Kriterien einer gestellten Anfrage erfllen. In englischer Sp
19、rache ist es mglich die Themen-Komponente des Index zu benutzen. Diese wird automatisch erstellt und erlaubt es Dokumente zu finden die konzeptionell mit der gestellten Anfrage beschftigen.SELECT SCORE(1) title from newsWHERE CONTAINS(text, about(politics) ,1) 0;Diese Anfrage findet alle Dokumente d
20、ie von politics handeln, also nicht nur das Wort enthalten.,Oracle8i interMedia Text Einfhrung,1.7 DokumentenprsentationNormalerweise werden die Resultate einer Anfrage dem Benutzer angezeigt. Der Benutzer whlt einen Eintrag aus und die Anwendungsumgebung wird das Dokument prsentieren.Mit interMedia
21、Text bestehen zwei unterschiedliche Wege Es besteht die Mglichkeit ein Dokument mit hervorgehobenen Begriffen anzuzeigen. Dabei sind die Terme der gestellten Anfrage hervorgehoben.Solche Terme knnen die Wrter der Anfrage oder die Terme einer ABOUT-Anfrage sein.Dabei werden fr verschiedene Dokumenten
22、formate unterschiedliche Prozeduren verwendet.,Oracle8i interMedia Text Einfhrung,1.7 Dokumentenprsentation TextausgabetypenTextausgabetyp Procedure Hervorgehoben Plaintext CTX_DOC.MARKUP Hervorgehoben HTML_Version CTX_DOC.MARKUP Hervorgehoben offset Info. Plaintext CTX_DOC.HIGHLIGHT Hervorgehoben o
23、ffset Info. HTML CTX_DOC.HIGHLIGHT Plain text CTX_DOC.FILTER HTML CTX_DOC.FILTER,Oracle8i interMedia Text Einfhrung,1.8 SQL-KommandosALTER INDEXwird verwendet um folgende Aufgaben zu realisierenUmbenennen eines IndexNeuaufbau des Index mit anderen EinstellungenWeiterfhren eine fehlgeschlagenen Index
24、operationDurchfhren von Indexwartung ( DML )IndexoptimierungHinzufgen von Stopwrtern zum IndexALTER INDEX schema.index_name RENAME to new_index_name;ALTER INDEX schema.index REBUILD online parameters ( paramstring);,Oracle8i interMedia Text Einfhrung,DROP INDEXwird benutzt um einen Index zu verwerfe
- 1.请仔细阅读文档,确保文档完整性,对于不预览、不比对内容而直接下载带来的问题本站不予受理。
- 2.下载的文档,不会出现我们的网址水印。
- 3、该文档所得收入(下载+内容+预览)归上传者、原创作者;如果您是本文档原作者,请点此认领!既往收益都归您。
下载文档到电脑,查找使用更方便
2000 积分 0人已下载
下载 | 加入VIP,交流精品资源 |
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- TEXTDATENBANKENORACLE8IINTERMEDIATEXTVERSION3010PPT

链接地址:http://www.mydoc123.com/p-373212.html