Lov om fordeling af sætningslængder

fra Wikipedia, den gratis encyklopædi
Spring til navigation Spring til søgning

I lingvistik omhandler loven om fordelingen af ​​sætningslængder spørgsmålet om, hvor ofte sætninger af forskellig kompleksitet bruges i tekster. Et særligt simpelt kriterium for sætningskompleksitet er dens længde , som kan defineres på forskellige måder: som antallet af bogstaver, stavelser, ord, undersætninger osv. Pr. Sætning. Hvis man undersøger, hvor ofte sætninger af forskellig længde forekommer i tekster til tekster, kan man se, at de styres af en sproglov. I princippet handler det om den samme sproglov, der også påvirker frekvensfordelingen af ordlængder ( lov om fordelingen af ​​ordlængder ; teori: Wimmer et al. [1] ).

Brug af forskellige definitioner til sætningskompleksitet

Wilhelm Fucks bestemte sætningslængden i henhold til antallet af stavelser pr. Sætning, opdelte sætningerne i klasser på 1-5, 6-10 stavelser og så videre, og navngav polya -fordelingen som en model, der passer til stilen hos en række forfattere . [2] Hvis sætningslængden bestemmes i henhold til antallet af delsætninger ( klausuler ) pr. Sætning, kan Hyperpoisson -fordelingen ses som en god model for omkring 500 tyske tekster. [3] Med andre kriterier for sætningslængde [4] , på andre sprog, med andre teksttyper osv., Er andre modeller ofte mere egnede. Hvis du f.eks. Vælger antallet af ord pr. Sætning som kriterium for sætningslængde, kan den negative binomiske fordeling bruges som model for tyske tekster. [5]

Hvis længden af ​​syntaktiske konstruktioner på den anden side bestemmes af antallet af deres endeknuder, så overholder disse også love. [6]

I stedet for sætningernes længde kan du også vælge sætningsdybden som et mål for kompleksitet. Sætningsdybden kan være z. B. defineret af de regelsæt, der er nødvendige i en generativ syntaks for at generere en sætning; ækvivalent: antal noder i en trægraf for et sådant sæt. Tilsvarende distributionslove gælder også i denne sag. [7]

Sammenfattende kan det siges, at undersøgelserne af sætningslængder hidtil understøtter den hypotese, som kvantitativ lingvistik går ind for, om, at sprogsystemet og brugen opfører sig i henhold til visse teoretisk forsvarlige sproglove .

Et eksempel

Følgende tabel giver et eksempel på en fordeling af sætninger af forskellig længde (målt som antallet af klausuler) i en kort tysk prosatekst. [8] Observationsdataene er hentet fra undersøgelsen foretaget af Niehaus (1997), passformen af ​​Hyperpoisson -distributionen blev genberegnet. [9]

x n (x) NP (x)
1 73 68,40
2 30. 36,44
3 21 19.14
4. 9 9,92
5 6. 5,07
6. 3 2.56
7. 1 1,27
8. 1 1,20

(Hvor x er antallet af klausuler pr. Sætning, der starter med x = 1; n (x) er antallet af sætninger med x -klausuler observeret i denne tekst; NP (x) er antallet af klausuler , der beregnes, når en passer til Hyperpoisson -fordeling til de observerede data Resultat: Hyperpoisson -fordelingen er en god model for denne tekst med testkriteriet P = 0,84, hvor P betragtes som god, hvis den er større end eller lig med 0,05 For mere detaljerede forklaringer henvises til litteraturen citeret.)

Se også

litteratur

  • Gabriel Altmann : Fordeling af sætningslængder . I: Klaus-Peter Schulz (red.): Glottometrika 9 . Brockmeyer, Bochum 1988, side 147-169. ISBN 3-88339-648-6 .
  • Gabriel Altmann: Gentagelser i tekster . Brockmeyer, Bochum 1988. ISBN 3-88339-663-X .
  • Karl-Heinz Best : Sætningslængder på tysk: distributioner, middelværdier, sprogændring . I: Göttinger Bidrag til lingvistik 7, 2001, side 7–31.
  • Karl-Heinz Bedst: Hvor mange ord er der på tysk? Et bidrag til Sherman Altmann -lovene. I: Karl-Heinz Best (redaktør): Frekvensfordelinger i tekster. Peust & Gutschmidt, Göttingen 2001, side 167-201. ISBN 3-933043-08-5 .
  • Karl-Heinz Best: sætningslængde . I: Reinhard Köhler , Gabriel Altmann og Rajmund G. Piotrowski (red.): Quantitative Linguistics - Quantitative Linguistics. En international håndbog . de Gruyter, Berlin / New York 2005, sider 298–304. ISBN 3-11-015578-8 .
  • Anja Kaßel, Eleanor Livesey: Undersøgelser af hyppigheden af sætningslængder på engelsk: Brug af eksempler på tekster fra pressen og journalistik, litteratur (fiktion) . I: Glottometrics 1, 2001, side 27-51. (PDF i fuld tekst )
  • Emmerich Kelih: Undersøgelser af sætningslængde i russiske og slovenske prosatekster . Bind 1 og bind 2. Diplomafhandling, Graz 2002.
  • Emmerich Kelih, Peter Grzybek : Sætningslængder: definitioner, frekvenser, modeller . I: A. Mehler (red.): Kvantitative metoder inden for computinglingvistik og sprogteknologi . [= Specialudgave af: LDV Forum. Journal for Computational Linguistics and Language Technology // Journal for Computational Linguistics and Language Technology 2004.]
  • Ioan-Iovitz Popescu, Karl-Heinz Best, Gabriel Altmann: Unified Modeling of Length in Language . RAM-Verlag, Lüdenscheid 2014. ISBN 978-3-942303-26-2 . (Kapitel "Sætningslængde", side 94–107.)
  • Martin Wittek: Om udviklingen af ​​sætningslængde på samtidstysk. I: Karl-Heinz Best (redaktør): Frekvensfordelinger i tekster. Peust & Gutschmidt, Göttingen 2001, side 219-247. ISBN 3-933043-08-5 .

Individuelle beviser

  1. Gejza Wimmer, Gabriel Altmann: Theory of Word Length Distribution: Some Results and Generalizations. I: Peter Schmidt (red.): Glottometrika 15. Spørgsmål i almen sproglig teori og teorien om ordlængde . Wissenschaftlicher Verlag Trier, Trier 1996, side 112-133, ISBN 3-88476-228-1 ; Gejza Wimmer, Reinhard Köhler, Rüdiger Grotjahn & Gabriel Altmann: Mod en teori om ordlængdefordeling. I: Journal of Quantitative Linguistics 1, 1994, 98-106; Arkiveret kopi ( erindring om originalen fra 13. april 2014 i internetarkivet ) Info: Arkivlinket blev indsat automatisk og er endnu ikke kontrolleret. Kontroller det originale og arkivlink i henhold til instruktionerne, og fjern derefter denne meddelelse. @ 1 @ 2 Skabelon: Webachiv / IABot / lql.uni-trier.de
  2. ^ Wilhelm Fucks: Ifølge alle kunstens regler. Deutsche Verlags-Anstalt, Stuttgart 1968, side 84-88.
  3. For at se, om Hyperpoisson -distributionen er egnet til sammenligning med andre distributioner, når du bruger dette kriterium, se Best 2005, side 301.
  4. Se f.eks .: Emmerich Kelih, Peter Grzybek: Sætningslængdes frekvenser: Om intervallets størrelse som en påvirkende variabel ( ved hjælp af eksemplet med slovenske tekster) . I: Glottometrics 8, 2005, side 23-41. (PDF i fuld tekst. )
  5. Derudover: Bedste 2001, Wie Many Words ..., 198f.
  6. Arkiveret kopi ( erindring om originalen fra 22. januar 2016 i internetarkivet ) Info: Arkivlinket blev indsat automatisk og er endnu ikke kontrolleret. Kontroller det originale og arkivlink i henhold til instruktionerne, og fjern derefter denne meddelelse. @ 1 @ 2 Skabelon: Webachiv / IABot / lql.uni-trier.de
  7. Arkiveret kopi ( erindring om originalen fra 21. januar 2017 i internetarkivet ) Info: Arkivlinket blev indsat automatisk og er endnu ikke kontrolleret. Kontroller det originale og arkivlink i henhold til instruktionerne, og fjern derefter denne meddelelse. @ 1 @ 2 Skabelon: Webachiv / IABot / lql.uni-trier.de
  8. Det handler om: Gert Prokop: Musen i vinduet . I: Gert Prokop: Musen i vinduet. Godtidshistorier . Benziger, Zürich / Köln 1982, side 7-18, ISBN 3-545-31111-2 .
  9. Brigitta Niehaus: Undersøgelse af hyppighed af sætningslængde på tysk . I: Karl-Heinz Best (red.): Glottometrika 16. Ordets fordeling og sætningslængde. Wissenschaftlicher Verlag Trier, Trier 1997, side 213-275, data side 240. ISBN 3-88476-276-1 .

Weblinks

Wiktionary: sætningslængde - forklaringer på betydninger, ordoprindelse, synonymer, oversættelser
Wiktionary: distribution af sætningslængde - forklaringer på betydninger, ordoprindelse, synonymer, oversættelser