Zum Inhalt springen
(Andrea)

Wortwiederholungen und Lieblingswörter !! Gefunden !!

Empfohlene Beiträge

Hallo EBBY,

 

habe mir das Programm runtergeladen und bin zufrieden. Ist einfach zu bedienen, auch wenn ich noch nicht alle Funktionen kenne.

 

Danke für den Tip

 

Gruß Jörg

Link zu diesem Kommentar
Auf anderen Seiten teilen

(Peter_Dobrovka)

Ich habe mir das Teil nun auch mal angesehen und es wohl auch rasch begriffen.

Was mich jetzt noch interessieren würde: Was genau für Erleuchtungen bringt mir dieses Tool? Ich komme mir vor wie einer, der ein Raumschiff gefunden hat aber nicht weiß, wohin er damit eigentlich fliegen soll.

 

Hat hier irgendwer praktische Anwendungsbeispiele aus seiner eigenen Arbeit?

 

Peter

Link zu diesem Kommentar
Auf anderen Seiten teilen

Zu: »Was genau für Erleuchtungen bringt mir dieses Tool?«

 

Es zeigt »schlechte« Text-Eigenschaften auf, Manien, die jedem Schriftsteller unterlaufen.

 

Unter anderem die zahlreiche Verwendung von »sich«, »dass« und »hatte«, diese verschleppen den Text, sie sind zwar unbedingt notwendig, jedoch sollte sie nur wie das Salz in der Suppe verwendet werden, dosiert!

 

Derlei kann natürlich bewusstes Stilmittel sein oder nur Fehler, Unzulänglichkeit …

 

Man darf selbstverständlich nie Sklave solcher Auswertungen werden. Vor lauter Angst, »das darf ich nicht«, wird ein Text nur schlechter. Wenn es die Romanstelle verlangt, verwendet man eben auch lange Wörter, verpönte Ausdrücke, weil es DIE Darstellung für genau DIESE Stelle es verlangt. Natürlich, wenn einmal der Text steht und entsprechend lange geruht hat, ist es schon gut, kritisch an eine Überarbeitung heranzugehen.

 

Notwendigerweise gibt es bestimmte Wortgruppen, die gehäuft vorkommen. An der Spitze stehen der-die-das und so fort. Man kann jedoch aus solchen Statistiken viel ableiten. Vor allem, wenn man »gute« Texte etablierter Autoren aus dem Internet oder von einer CD zur Gegenanalyse heranzieht. Erstellt man auf Grund solcher Statistiken gar eine Graphik, sieht sie wie eine Sprungschanze aus. An einem Ende die bereits erwähnten Wortgruppen der-die-das und so weiter, der Bogen fällt ab und mündet in den eigentlichen - hier flachen - Absprung.

 

Wenn man nun »gute« Texte, wie beispielsweise Kafkas »Die Verwandlung« analysiert, so bekommt man eine Kurve, die schnell abfällt und in einen langen weiten Bogen mündet. Dies bedeutet, von der Gesamtanzahl der Wörter im Text gesehen, verwendet Kafka in dieser Erzählung viele unterschiedliche Wörter, diese jeweils nicht häufig. Er hat ein weiträumiges Wortspektrum.

 

Häufig bei Anfängertexten zu beobachten, dass vor allem junge Leute eine kurze und sehr steile Kurve zeigen. Im Verhältnis zur Gesamtanzahl der Wörter im Text setzen sie wenige Wörter ein, diese dafür häufig (quasi verdorrende Wortarmut  :s22 ).

 

Auch einen weiteren Fehler kann man damit beweisen. Derartige Autoren sind zwar selten, aber auch gelegentlich in der Newcomer-Klasse anzutreffen. Es sind Leute, die aus nahezu jedem Nebensatz einen Hautsatz gestalten. In der Regel ist der Satzgegenstand im Hauptsatz verankert und mit Beistrich zum Nebensatz hin verbunden/abgegrenzt. Nun kommen Schreiber, die setzen einen Punkt und schreiben den Nebensatz groß weiter. Sie merken aber selber, dass der Satz unvollständig ist! Daher benötigen sie einen Anker. Sie weisen auf den Satzgegenstand mit bespielweise »er« hin: er, er, er (bzw. sie). In der Statistik springt in diesem Fall das ER weit vor die der-die-das-Grenze.

 

Einen weiteren Makel kann man auch feststellen, die Verwendung unbewusster Manien (Lieblingsworte). Bei mir war es das »doch«-Syndrom neben »auch«. Etwa: ... »er ging, doch ...« - Mir ist nie in den Sinn gekommen, dass ich vielleicht einmal stattdessen »aber« schreiben oder überhaupt dieses Wort weglassen könnte. In der Zwischenzeit habe ich meine »doch«-Schwemme eliminiert.

 

Obiges Programm weist eine Besonderheit auf. Du kannst ein Wort deiner ungewollten Manie, mittels der Graphik visualisieren. Der Balken mit den Strichcode zeigt dir optisch sehr gut, wo beispielweise - nehmen wir an, das Wort »Schwein« - überall sitzt. Hatte mit Schwein ein konkretes Beispiel. Wenn nun auf einmal ein dicker Balken inmitten der Textachse steckt, so kannst du ihn anklicken. Das Programm springt in die Textstelle und hebt das Suchwort überall hervor. Wenn du nun angenommen auf einer kaum halben Seite 10x »Schwein hervorgehoben siehst, dann überlegst du schon, ob du nicht vielleicht einmal Sau, Borstenvieh, Ferkel und dergleichen einsetzen solltest.

 

Häufige Probleme sind, auch Bezeichnungen wie Mann, Frau usw., weil beispielsweise in einem Kaffeehaus mehrere Besucher vorkommen. Keiner ist mit einem Namen oder einer Beschreibung fixiert. Dann holt ein Mann die Zeitung, ein anderer rührt im Kaffee, einer kratzt sich. Dem Autoren selber ist wohl klar - nur für ihn alleine -, dass einmal der am Fenster, der andere an der Türe gemeint ist. Der Leser absolviert hierbei zu oft eine geistige Bauchlandung. Solche Anhäufungen fallen im Balkencode des Tools als gehäufte Schwärzung auf. Dann kann man hinspringen und vielleicht Rothaariger, Weißbart und dergleichen Einsetzen, um die Trennung der Figuren für den Leser zu erleichtern.

 

Das wären Beispiele. Wenn man das öfters mit fertigen Texten durchführt, vermeidet man unwillkürlich mit der Zeit solche Konstrukte.

 

Nochmals: Zur Maxime darf derlei nicht werden! Es kann nur ein Hilfsmittel sein. Auch Regeln sind nicht allgemein gültig. Wer Goethes Werter auf der ersten Seite aufschlägt, dem fahren gleich mit den ersten Absätzen überproportional »daß«-Pfeile in die Augen, wenn möglich mehrmals in einem Satz. Allerdings, Goethe steht bereits außerhalb jeglicher Kritik. Man muss auch den Zeitpunkt der Niederschrift beachten, die Zeit überhaupt. Heute würde keiner mehr mir solchen Wurmgebilden einen Roman beginnen.

 

EBBY

Link zu diesem Kommentar
Auf anderen Seiten teilen

Hallo Ebby,

 

ich habe mir das Programm ebenfalls mal runtergeladen und ausprobiert. Was du über die Kurve sagst, scheint mir aber nicht ganz richtig. Anfäger dürften eine kurze, flache Kurve haben und Fortgeschrittene eine lange, die nach den häufigen Worten ziemlich schnell abfällt, dafür aber sehr viele Worte nur 1 oder 2 mal verwendet. Oder habe ich da was falsch verstanden? Die Kurve macht das Programm aber nicht, oder?

 

Ansonsten finde ich beide Concordance Programme sehr nützlich!! Vielen Dank deshalb auch an dich.

 

LG

Katja

Kritik anzunehmen heißt nicht gleich alles zu ändern, aber zumindest darüber nachzudenken.

Link zu diesem Kommentar
Auf anderen Seiten teilen

Ansonsten finde ich beide Concordance Programme sehr nützlich!!

Hallo Katja,

bevor ich mir die Mühe mache und dieses Programm auch noch runterlade, meinst Du es ist besser als Simple Concordance, nützlicher, einfacher zu bedienen? Oder ist es einfach nur anders?

Ich finde nämlich die Bedienung von SC etwas kryptisch und würde mich über ein einfacheres Programm freuen.

Danke

Stefan

Link zu diesem Kommentar
Auf anderen Seiten teilen

Was du über die Kurve sagst' date=' scheint mir aber nicht ganz richtig. Anfäger dürften eine kurze, flache Kurve haben und Fortgeschrittene eine lange, die nach den häufigen Worten ziemlich schnell abfällt, dafür aber sehr viele Worte nur 1 oder 2 mal verwendet. Oder habe ich da was falsch verstanden? Die Kurve macht das Programm aber nicht, oder?[/quote']

Genauso ist es: Anfänger verwenden eher wenig Worte, die im Text dafür oft vorkommen, Fortgeschrittene verwenden einen größeren Wortschatz.

 

Mit dem Bild einer Sprungschanze wollte ich bildhaft ausdrücken, was ich meine. Eine solche Kurve selber zeichnet das Programm nicht. Man kann aber im Bedarfsfalle mit einer Funktion den Statistikfile exportieren und in ein Programm wie Excel laden, um statistische Torten, Kurven und dergleichen (für einen Vortrag) daraus zu kreieren.

 

Eine besondere Graphik zeigt dieses Programm wohl, es stellt die Verteilung gesuchter Wörter im Text als Barcode dar. Dadurch werden Anballungen von Wortmanien oder auch die Überprüfung verpönter Ausdrücke sehr schön sichtbar gemacht, die einem im Text selber gar nicht so auffallen: Man läd eine Datei (»File«, »Open«), geht auf »Word List«, sieht in der Statistik welche Wörter wie oft vorkommen, und kann sein Problemwort anklicken. Daraufhin geht man auf »Corcordance Plot« und sieht den Text als Strichcode dargestellt. Diesen kann man vergrößern(»Zoom In/Out«). Klickt man auf einen besonders dicken Balken, spring das Programm zur Stelle im Text und hebt bei dieser Anhäufung die Wortstellen hervor. Einfacher geht es nicht.

 

Man kann auch mehrere Textfiles (Textstadien) zugleich/nebeneinander  vergleichen …

 

EBBY

Link zu diesem Kommentar
Auf anderen Seiten teilen

Hallo Rocker,

 

ich habe simple concordance auch nur einmal ausprobiert, fand dazu die Erklärungen von Andrea sehr hilfreich, das Programm von Ebby scheint auf den ersten Blick etwas kompliziert, ist es aber eigentlich garnicht. Vorher TExt in einen Textpad kopieren, sonst gibt es komische Sonderzeichen.

 

Vielleicht ist Ebbys Programm dann etwas ausführlicher (könnte aber auch daran liegen, dass ich sc nicht so lange ausprobiert habe. Beide Programme habe ich als totaler Dummy aber gut hinbekommen.

 

Ich finde es ganz hilfreich.

 

@Ebby,

 

danke für die Erläuterungen.

 

LG Katja

Kritik anzunehmen heißt nicht gleich alles zu ändern, aber zumindest darüber nachzudenken.

Link zu diesem Kommentar
Auf anderen Seiten teilen

(Peter_Dobrovka)

Gibt es denn auch eine Methode, auf Problemwörter überhaupt zu kommen? Bei mir war es mal in einem früheren Buch der Ausdruck "erinnerte entfernt an ...", ca. 10 mal oder so kam es vor, fiel einer Probeleserin auf.

 

 

So, und nun hab ich hier mal ein konkretes Beispiel, meinen Roman "Dämonentränen":

 

Insgesamt sind es 134175 Wörter. Und zwar 14272 unterschiedliche Wörter (case natürlich ausgeschaltet).

Das häufigste Wort ist "sie", es kommt 4173 mal vor. (=3,110 Prozent)

 

Hier die Top 50:

3,110 sie

2,563 und

2,166 die

1,590 der

1,535 nicht

1,523 er

1,482 das

1,438 zu

1,335 ich

1,330 sich

1,182 es

1,179 war

1,136 in

1,043 den

0,895 mona

0,856 auf

0,800 mit

0,794 ein

0,721 du

0,713 hatte

0,639 ihr

0,610 daß

0,590 was

0,581 an

0,569 eine

0,560 wie

0,548 ist

0,546 aber

0,528 frank

0,514 als

0,508 doch

0,495 noch

0,485 von

0,455 so

0,433 auch

0,433 dem

0,420 aus

0,411 dann

0,402 nur

0,385 wieder

0,380 einen

0,361 wenn

0,341 ihre

0,335 ihn

0,321 um

0,312 sein

0,291 wir

0,287 im

0,286 vor

0,282 ihm

 

Die Kurve fällt am Anfang sehr steil ab, wird danach aber sehr flach. Ab dem Wort Nr. 6157 (bis 14272) kommt jedes nur noch einmal vor.

 

Und hier ein Bildchen:

http://www.eldur-verlag.de/things/dt-dia01.gif

 

Wäre ja interessant, wenn man sich hier mal vergleichen könnte, um dann zu versuchen, irgendwelche Schlüsse zu ziehen.

 

Peter

Link zu diesem Kommentar
Auf anderen Seiten teilen

Mann Leute,

 

schreibt lieber, anstatt mit so einem Techno-Quatsch die Zeit zu vertun :s14

Wenn eure Story gut ist, wird sie auch genommen. Für den Feinschliff sind dann Lektoren zuständig.

 

Gruß,

 

Thomas

Link zu diesem Kommentar
Auf anderen Seiten teilen

Hm... ich habe das Tool installiert und über meinen aktuellen Text laufen lassen. Dabei kommt aber so etwas heraus:

 

3922 und

3005 die

2956 sie

2902 der

2013 er

1849 das

1756 es

1688 in

1646 sich

1430 den

1421 ich

1409 zu

1292 nicht

1133 war

1130 auf

1017 eine

1002 ist

996 ein

976 dass

890 mit

873 aber

805 von

776 patrick

707 dem

703 wir

698 peter

695 wie

694 an

683 als

640 so

618 einen

610 was

596 aus

568 hatte

565 dann

551 des

536 auch

480 noch

...

und so geht es weiter.

 

Weder wundert mich dieses Ergebnis, noch scheint es mir aussagekräftig.

Zumal einem natürlich niemand sagt: "568 mal hatte? Und das bei 14.000 Wörtern? Also das ist definitiv zu viel, versuch mal unter 540 zu kommen."

 

Irgendwie erschließt sich der Nutzen des Programmes noch nicht für mich.

 

Andreas

Link zu diesem Kommentar
Auf anderen Seiten teilen

(Peter_Dobrovka)

Wie häufig ist es denn, Stefan?

Komm doch mal rüber in diesen Thread hier: (Link ungültig)

 

und zeig uns deine "Top 50"

 

Peter

Link zu diesem Kommentar
Auf anderen Seiten teilen

Hallo Andreas,

ich plädiere dafür, dass du unbedingt Patrick und Peter streichst. Für Allerweltsvornamen einfach zu häufig ;)

Eine Frage an die Männer mit den dollen Kurven: Wie entwickelt ihr eigentlich von der Kurve her ein Sprachgefühl?

Schmunzelnde Grüße,

Petra

Link zu diesem Kommentar
Auf anderen Seiten teilen

Hm ... stimmt ... Word behauptet, es seien 124.000 ... das Programm hat sich entschieden, aus meinem Text nur ca. 14.000 "Keywords" herauszufischen und in denen zu zählen ... wie auch immer, was auch immer ... ???

Link zu diesem Kommentar
Auf anderen Seiten teilen

Vielleicht 14.000 verschiedene Wörter oder so?

Ein Text mit 14.000 Wörtern und 4.000 Mal "und" wäre allerdings wieder ein echtes Experiment.

Link zu diesem Kommentar
Auf anderen Seiten teilen

(Peter_Dobrovka)

Ca. 14.000

Entweder fehlt da eine Null oder es ist eine völlig falsche Zahl. Überleg mal: 3922 mal "und" bei nur 14000 Wörtern?

 

Ich glaube, du hast 14000 verschiedene Wörter.

 

Peter

Link zu diesem Kommentar
Auf anderen Seiten teilen

Hey.. das hat dann ja auch eine enorme Aussagekraft, in Bezug auf Wortschatz ...

 

Ein Autor zählt bei 150.000 Wörtern 15.000 verschiedene Worte, ein anderer 10.000 verschiedene, bei gleichem Unfang.

 

 

 

Grüße

Quidam

Link zu diesem Kommentar
Auf anderen Seiten teilen

(Peter_Dobrovka)

Ich möchte gerne noch weitere Daten sammeln, das ist irgendwie spannend. Andreas und ich, wir haben in etwa den gleiche Anzahl Wörter und unterschiedlicher Wörter, und wir haben auch noch dieselben Wörter in unseren Top 38!

 

Peter

Link zu diesem Kommentar
Auf anderen Seiten teilen

Ergo sagt die Statistikerin, kann ich jetzt Andreas' Buch wegwerfen und durch deins ersetzen.

Ihr habt Sorgen...

 

Nicht ganz ernstgemeinte Grüße,

Petra,

die jetzt gleich mal die Quersumme aus dem Werbetext ihrer TK-Quiche-Lorraine in Relation zu Quidams Posting-Wortschatz setzt

Link zu diesem Kommentar
Auf anderen Seiten teilen

Hey.. das hat dann ja auch eine enorme Aussagekraft, in Bezug auf Wortschatz ...

 

Ein Autor zählt bei 150.000 Wörtern 15.000 verschiedene Worte, ein anderer 10.000 verschiedene, bei gleichem Unfang.

Grüße

Quidam

Ist jetzt auch wieder Korintherkackerei von meiner Seite, aber es kommt unter Umständen auch auf die Erzählperspektive an, welchen Bildungsgrad der Perspektivträger hat, welchen Wortschatz der wiederrum hat usw.

Man kann vielleicht mit solchen statischen Möglichkeiten wirklich schauen, ob man ein paar wirklich unbeabsichtigte Dinger drin hat(das Wort "wirklich" scheint heute wirklich mein Lieblingswort zu sein), wenn man also in einer Phase so ein Lieblingswort hat und es dann unbewußt sehr oft verwendet und es im Nachhinein nicht reinpasst oder wirklich stört.

 

In der Stilfibel von Reiners gibt es so eine ähnliche Methode einen Text derat schematisch zu untersuchen. Wörterzählen pro Satz, wieviele Hauptworte, wieviele Substantive, wieviele Konkreta, wieviele Abstrakta und dann liefert er eine Tabelle, an der man ablesen kann, wie "verständlich" ein Text ist.

 

Naja, ich seh das ein bisschen skeptisch, aber ist mal interessant zu sehen, wie oft gerade solche Partikel vorkommen.

Link zu diesem Kommentar
Auf anderen Seiten teilen

Hallo Andreas,

 

das Programm zählt die Worthäufigkeit, wie oft eine Buchstabenkombination in deinem Text vorkommt.

(Okay, nur für Anfänger. Profis haben keine Wortwiederholungen mehr ;) )

 

In deinem Text von 124.000 Wörtern nutzt du 14.000 verschiedene Wörter (wobei da verschiedene Verbformen, deklinierte Adjektive etc. einzeln zählen.)

Wie Quidam schon sagte: 14.000 ist da schon ganz üppig :)

Aus deiner Liste lese ich heraus:

'und' sind ziemlich viel. Fast ein Viertel mehr als die normal häufigen 'der' oder 'die'. Bei einem derartigen Ausreißer nach oben würde ich meine gesamten 'und' in Word farbig hervorheben lassen und einen Blick drauf werfen.

'nicht' steht auf der Liste an passender Stelle. Bei mir stand das in der Rangfolge viel zu weit oben (wie Quidam vorher ohne Programm festgestellt hat :-* )

'dass' kommt jetzt darauf an. Im Text oder im Dialog?

Ich habe hier gelernt: zu viele 'dass' im Text sind nicht gerade das Gelbe vom Ei. Im Dialog dagegen spricht fast jeder so.

Wem würde ich von dieser Liste noch einen kritischen Blick schenken ... war, hatte, dann, aber, auch ... weil ich die selbst gerne etwas zu oft in der Rohfassung schreibe. Und weil diese Wörter beim Durchlesen einen Unsichtbarkeitstrick anwenden (Houdinis gelehrige Schüler), bekommen sie von mir spezielle Aufmerksamkeit.

 

Was dieses Programm nützt: es findet Wortwiederholungen und Lieblingswörter.

Mein Lieblingswort war eindeutig 'nicht'. Ich bin der Typ der lieber sagt: das hast du jetzt nicht gut gemacht; anstatt: das hast du schlecht gemacht. Nur hat meine Vorliebe nichts bei den Personen meines Romans zu suchen.

Hätte ich Stefan nicht schon vorher gesagt, dass er meiner Meinung nach zu viele mit 'und' verkettete Hauptsätze hat, bei denen der zweite Satz aber nichts mit dem ersten zu tun hat, hätte er es so selbst herausfinden können.

 

Interessant wird die Liste weiter unten. 50 mal das Wort 'unermesslich'? Und das nicht im Dialog sondern im Text? Da würde ich stutzen.

Bei solchen Lieblingswörter kann dieses Programm die Aufmerksamkeit schärfen (oder man hat solch geniale Erstleser wie in diesem Forum - aber deren Aufmerksamkeit kann bei Romanlänge auch schwächer werden - und eben nicht jeder hat solche Erstleser)

 

Was wäre noch interessant? Ach ja: ob man bei 14.000 Wörtern 5000 Adjektive dabei hat oder nur 500. Aber wartet, da beginne ich lieber einen neuen Thread.

 

Viele Grüße

Andrea

Link zu diesem Kommentar
Auf anderen Seiten teilen

Hallo,

 

weil hier auch nach einem einfacheren Programm für die Worthäufigkeit gefragt wurde:

Das Programm WortSort (in Deutsch und Freeware)

(Link ungültig)

 

das ich im Thread 'Wortliste alle Adjektive dekliniert' vorgestellt habe, berechnet ganz einfach die Worthäufigkeiten und gibt eine Liste nach Häufigkeit sortiert aus. (keine Anzeige der Sätze etc.)

 

Viele Grüße

Andrea

Link zu diesem Kommentar
Auf anderen Seiten teilen

Andrea,

das war ein guter Tip. Nicht lange runterzuladen und wirklich einfach zu bedienen.

Was mich nun aber schockiert ist, dass ich wohl zu den Dumpfbacken gehöre, denn das Programm findet in meinen 350 MS nur rund 4400 verschiedene Worte. Anscheinend schreibe ich zu einfach und habe den Wortschatz eines Analphabeten.

Gruß

Rabe

Link zu diesem Kommentar
Auf anderen Seiten teilen

Bitte melde Dich an, um einen Kommentar abzugeben

Du kannst nach der Anmeldung einen Kommentar hinterlassen



Jetzt anmelden


×
×
  • Neu erstellen...