tesaurus

fra Wikipedia, den gratis encyklopædi
Spring til navigation Spring til søgning

En tesaurus ( oldgræsk θησαυρός thesaurós, skattejagt, skatkammer ', latin derefter synonymordbog, dermed også sikker ) eller word-netværk er et kontrolleret ordforråd i dokumentation videnskab , de vilkår for der er forbundet af synonymi relationer. Udtrykket bruges også til sproglige tesaurier eller videnskabelige ordforrådssamlinger af et sprog.

Generelt

En tesaurus er en model, der forsøger at præcist beskrive og repræsentere et emne. Det består af en systematisk arrangeret samling af udtryk, der er tematisk relateret til hinanden. Synonymordbogen er et kontrolleret ordforråd, også kaldet et attributværdiinterval, for at den respektive attribut kan beskrives. Hovedsageligt synonymer , men også generelle og undertermer administreres. Ofte er antonymer (modsatte udtryk) imidlertid ikke opført.

Eksempel: billede (synonym: billede, illustration, portræt; generisk betegnelse: repræsentation; underudtryk: spejlbillede, maleri); Tømrer (synonym: tømrer; generisk betegnelse: håndværker, træbeskæftigelse; underudtryk: møbelsnedker, byggemester)

historie

I ordets generelle betydning henviste det i første omgang til et "videnslager" såsom en ordbog eller et leksikon. I 1572 dukkede fem-bind tesaurus Graecae Linguae af Henricus Stephanus (Henri Estienne) op, den mest omfattende ordbog i sin tid, også nævnt i Samuel Pepys ' dagbøger (december 1661). Rogets Thesaurus of English Words and Phrases, som var særlig indflydelsesrig i den engelsktalende verden og udgivet i 1852 af Peter Mark Roget , ændrede udtrykets betydning i retning af en sproglig tesaurus.

Inden for informationssøgning blev udtrykket først brugt af Hans Peter Luhn i 1957, da forskellige indekseringssystemer blev udviklet i 1950'erne. De første tesaurier, der blev brugt til katalogisering, var Du Punt -systemet (1959) og Thesaurus of ASTIA Descriptors (1960). Et ensartet format for thesauri blev præsenteret i 1967 med Thesaurus of Engineering and Scientific Terms (TEST). Fra reglerne for strukturen af ​​tesaurier udviklet fra begyndelsen udviklede generelle standarder over tid, som definerer formen for den klassiske tesaurus til dokumentation. Disse inkluderer UNESCOs retningslinjer for etablering og udvikling af ensprogede thesaurier udarbejdet af Derek Austin og Dale, hvis indhold blev indarbejdet i ISO -standarden 2788 (1986). [1]

Dokumentation tesaurus

Polyhierarkiske tesaurusforhold ved hjælp af eksemplet med deskriptoren Mavekræft i overskriften for medicinske emner 2005 med alle dens generelle vilkår

Inden for dokumentationsvidenskab har tesaurus vist sig at være et egnet hjælpemiddel til indeksering af emner og til at finde dokumenter. Relationer mellem de enkelte udtryk bruges til at finde dem under indeksering (tildeling af søgeord) og under forskning . I modsætning til en sproglig tesaurus indeholder en tesaurus et kontrolleret ordforråd til dokumentation , det vil sige unikke termer ( deskriptorer ) for hvert udtryk. Forskellige stavemåder (foto / foto), synonymer eller kvasi-synonymer, forkortelser , oversættelser osv., Der behandles som ækvivalente, er relateret til hinanden gennem ækvivalensforhold . Begreber er også forbundet med associationsrelationer og hierarkiske relationer.

Synonymordbogen fungerer som et dokumentationssprog til indeksering, lagring og søgning af dokumenter. Relationerne gør det muligt at finde passende udtryk for søgte udtryk under indeksering og forskning. Når du søger, kan synonymordbog være nyttig, fordi søgeforespørgslen automatisk udvides til at omfatte synonymer og underord.

En tesaurus kan således også generelt tjene til at præcisere vilkår og har i bedste fald funktionen som en autoritetsfil. I modsætning til en monohierarkisk tabel eller database kan tesaurus have en polyhierarkisk struktur (dvs. et underudtryk kan have flere generiske udtryk).

Tesaurus-normerne DIN 1463-1 eller den internationale ækvivalent ISO 2788 indeholder følgende typer af relationer og tilhørende forkortelser:

Forkortelse og navn
DIN 1463-1 ISO 2788
BF Anvendes til UF Anvendes til
BS Brug synonym BRUG / SYN Brug synonymt
HVIS Generisk betegnelse BT Bredere sigt
UB Delperiode NT Smalere sigt
VB Relateret udtryk RT Relateret udtryk
SB Top sigt TT Top sigt

De mest almindelige relationer i en tesaurus er ækvivalens, forening og hierarkiske relationer.

Som regel defineres et element i en ækvivalensforhold, dvs. en betegnelse, som en foretrukken betegnelse. De ikke-foretrukne udtryk får en reference til det foretrukne udtryk, der svarer til dem.

Eksempel:
Køretøj refererer til underbetegnelserne lastbil og bil .
Auto refererer til det foretrukne udtryk PKW og med et associeringsforhold (“se ​​også”) til lastbiler .

Tesaurus som en samling

Forskellige former for synonymordbog

Tidligere blev en tesaurus forstået som en videnskabelig samling af hele et sprogs ordforråd. Kendt omfatter Thesaurus Linguae Graecae og Thesaurus Linguae Latinae . Disse værker er strengt taget ordbøger .

Den første synonymordbog brugt i elektronisk tekstbehandling ( EDP ) var også enkle ordbøger, der kunne matche det indtastede ordforråd med posterne og give brugeren feedback. Feedbacken kunne i første omgang kun bruges til at opdage simple stavefejl og kunne bestemmes med søgninger, men senere i baggrunden , hvilket svarer til nutidens standard. De nødvendige databaser hertil stammer oprindeligt fra ordsamlinger, der manuelt blev konverteret til dataformat, som oprindeligt løbende blev suppleret af producenten til kommercielle programmer og leveret til kunden med opdateringer . Med fremkomsten af ​​ordposter, der kan tilføjes individuelt af brugeren, opstod muligheden for at bruge store, kvasi-kollaborative, brugerbaserede platforme til at indsamle nye poster, idet databasen på en server kortvarigt vokser hurtigt på grund af tilbagevenden af individuelle arbejdskopier af synonymordbøger fra forskellige brugere. Også her var en manuel inspektion nødvendig for at forhindre indtastning af ofte stavefejl og derfor forkert ofte sendt forkert ordforråd. På grund af hvert sprogs begrænsede ordforråd er der nu næsten fuldstændige datasæt tilgængelige for de fleste sprog, der udtømmende gengiver det respektive sprog. Indtastningen af ​​nye ord i dag svarer kun til de respektive sprogs naturlige vækst.

På samme tid blev de elektroniske synonymordbøger udviklet til stadig mere komplekse programmer, der også kan styre grammatiske regler og stilregler og tilbyde synonymer. På deres grænseområder tilbyder moderne tesaurier nu også oversættelseshjælpemidler og gør det muligt at se tekster automatisk, hvorved brugeren kan vælge adskillige muligheder på forhånd.

Interkulturel synonymordbog

En særlig form for tesauri giver input bistand til piktogram skrifttyper såsom kinesisk scriptet ved hjælp af en vestlig computer tastatur . På grund af deres store antal kan disse tegn ofte ikke vises på praktisk håndterbare tastaturer, og derfor foreslår tesaurier tegn til brugeren, som derefter kan accepteres eller afvises af ham.

Der er mange metoder til indtastning af japanske eller kinesiske tegn, der konverterer stavelser eller forkortelser til tegn efter databaseposter i restauranten. Ingen af ​​disse metoder har imidlertid hidtil været i stand til at etablere sig på en standardiseret måde, fordi de asiatiske skriftsprog er meget komplekse og karakterernes betydning ofte er kontekstafhængig.

Læringsindsatsen for at bruge disse tesauribaserede programløsninger er ekstremt høj for asiater, og indfødte talere bruger normalt kun en softwareløsning, hvormed de kan opnå acceptabelt høje skrivehastigheder, hvilket dog ligger langt bagud i det latinske alfabet. Latinske forfattere skriver meget hurtigere end asiatiske forfattere, selvom læsehastigheden for piktogramskrifttyper er højere for kyndige læsere end med latinske scripts. Traditionelle, konceptuelle og syntaktiske problemer står i vejen for en ensartet synonymordbog for piktogramskrifttyper.

Sproglig tesauri

I en sproglig tesaurus er ord med lignende og beslægtede betydninger i stedet for udtryk forbundet med referencer . Denne type leksikalsemantisk organiseret opslagsværk kan blandt andet bruges som et formuleringshjælpemiddel. Der findes sådanne opslagsværker i trykt form [2] eller i elektronisk form, her mest som en baggrundsressource for tekstbehandlingsprogrammer .

Eksempler

Se også

litteratur

  • Retningslinjer for konstruktion, format og forvaltning af ensprogede kontrollerede ordforråd (ANSI / NISO Z39.19-2005) (PDF; 2,0 MB)
  • Thesaurus: Anmeldelse, renæssance og revision . Haworth, 2004, ISBN 0-7890-1978-7 / ISBN 0-7890-1979-5 (svarer til nummer 3/4, bind 37, 2004 i tidsskriftet Cataloging & Classification Quarterly )
  • Gernot Wersig : Thesaurus Guide: En introduktion til Thesaurus -princippet i teori og praksis . 2. tillægsudgave, Saur, 1985, ISBN 3-598-21252-6
  • Leonard Will: Publikationer om opbygning og brug af tesaurus . (online)
  • Bettina Brühl: Tesauri og klassifikationer. Naturvidenskab - teknologi - økonomi. 1. udgave, Verlag für Berlin-Brandenburg, 2005, ISBN 3-935035-63-2
  • ISO / FDIS 25964-1: Information og dokumentation - Thesauri og interoperabilitet med andre ordforråd - Del 1: Thesauri til informationssøgning, 2011-04
  • Bulitta Erich und Hildegard: Ordbog over synonymer og antonymer . 18.000 søgeord med 200.000 ordforklaringer . Krüger Verlag, Frankfurt am Main 1983, Fischer Taschenbuch, 5. udgave, 2011

Weblinks

Wiktionary: Thesaurus - forklaringer på betydninger, ordoprindelse, synonymer, oversættelser

Individuelle beviser

  1. ^ Jean Aitchison, Stella Dextre Clarke: Thesaurus: Et historisk synspunkt med et blik på fremtiden . I: Cataloging & Classification Quarterly 37, 3/4, 2004, s. 5-21.
  2. Duden. Ordbogen med synonymer. En ordbog med beslægtede ord. 4. udgave. Dudenverlag, Mannheim / Leipzig / Wien / Zürich 2006. ISBN 978-3-411-04084-1