Texterkennung altdeutsche Schrift

Einklappen
X
 
  • Zeit
  • Anzeigen
Alles löschen
neue Beiträge
  • wutz

    #1

    Texterkennung altdeutsche Schrift

    Hallo.
    Ich möchte Texte in der altdeutschen Schrift (Frankfurt gothik?) scannen und gerne mit mit einer Texterkennung verarbeiten. Kennt jemand ein solches Programm oder Zusatzprogramm? Hat jemand schon mal probiert, alte Gesetzestexte zu verarbeiten?

    Viele Grüße,
    Leif
  • Wigbold
    Heerführer

    • 25.11.2000
    • 3670
    • 76829 Landau / Pfalz
    • OGF - L + W

    #2
    Hallo Wutz,

    ich weiß nicht exakt, was Du meinst. Aber um ein ähnliches Problem ging es HIER mal.

    Vielleicht hilft es Dir !

    Daumendrückenderweise, Wigbold
    Trenne dich nie von deinen Illusionen und Träumen.
    Wenn sie verschwunden sind, wirst du weiter existieren, aber aufgehört haben, zu leben.

    Mark Twain



    ... weiter neue Wege gehen !

    Kommentar

    • Eifelgeist
      Ehren-Moderator
      Heerführer

      • 13.03.2001
      • 2593
      • Beute-„Rheinland-Pfälzer“

      #3
      @ wutz: Das geht im Prinzip mit jedem „besseren“ Texterkennungsprogramm, das „lernfähig“ ist. Fehlerrate bleibt aber je nach Vorlage trotzdem sehr hoch.

      @ Wigbold: Wutz meint die früher gebräuchlichen Frakturschriften (= Druckschrift).

      Helvetikus suchte damals einen Schriftkundigen für die Deutsche Schrift (= Schreibschrift). Ugs. nicht ganz zutreffend und verallgemeinernd als „Sütterlin“-Schrift bezeichnet.

      Gruß
      Eifelgeist
      Inschrift auf einem sächsisch-preußischen Grenzstein

      Wer hier vorüber geht, verweile!
      Hier läuft ein unsichtbarer Wall.
      Deutschland zerfällt in viele Teile.
      Das Substantivum heißt: Zerfall.

      Was wir hier stehn gelassen haben,
      das ist ein Grabstein, dass ihr's wisst!
      Hier liegt ein Teil des Hunds begraben,
      auf den ein Volk gekommen ist.


      Erich Kästner: Gesang zwischen den Stühlen (1932)

      Kommentar

      • Eifelgeist
        Ehren-Moderator
        Heerführer

        • 13.03.2001
        • 2593
        • Beute-„Rheinland-Pfälzer“

        #4
        @ wutz:

        Moin Leif,

        versuche es doch einmal mit dem Begriff „Frakturschrift+OCR“ über eine Suchmaschine, z. B. http://www.metacrawler.de

        Da gibt es eine Reihe Antworten.

        Gruß
        Eifelgeist
        Inschrift auf einem sächsisch-preußischen Grenzstein

        Wer hier vorüber geht, verweile!
        Hier läuft ein unsichtbarer Wall.
        Deutschland zerfällt in viele Teile.
        Das Substantivum heißt: Zerfall.

        Was wir hier stehn gelassen haben,
        das ist ein Grabstein, dass ihr's wisst!
        Hier liegt ein Teil des Hunds begraben,
        auf den ein Volk gekommen ist.


        Erich Kästner: Gesang zwischen den Stühlen (1932)

        Kommentar

        • wutz

          #5
          Danke!

          Hallo.
          Vielen Dank für Eure Tips. Ich werde mal ausprobieren, wie lernfähig mein Programm ist. Ich hatte vorher mal bei google gesucht, aber leider nichts wirklich brauchbares gefunden.

          Um hier vollends Verwirrung zu stiften, hier noch eine Frage. Aber zuerst der Hintergrung: Ich möchte eine Akte aus einem Archiv "verarbeiten". Ich darf sie abfotografieren.
          Nun die Frage: Kann man mit einer guten digitalen Fotografie auch die Texterkennung benutzen. Hat einer von Euch dies schon mal gemacht und könnte mir sagen, auf was ich speziell achten muß?

          Viele Grüße aus dem feuchten Norden,
          Leif

          Kommentar

          • Eifelgeist
            Ehren-Moderator
            Heerführer

            • 13.03.2001
            • 2593
            • Beute-„Rheinland-Pfälzer“

            #6
            Moin Leif,

            grundsätzlich sind die „besseren“ (lernfähigen) Texterkennungsprogramme in der Lage auch die gängigen Pixel-Grafikformate (.tif usw.) zu verarbeiten (z. B. OCR-Trace von Corel).

            Stativ, plane Vorlagen (Originale) und gleichbleibende Ausleuchtung vorausgesetzt, „könnte“ es was werden ... Minimum 10 - 30 % Fehlerquote eingerechnet ...

            Leider sind meine eigenen Erfahrungswerte über 10 Jahre alt. Damals noch mit Omnipage und „Dongel“ ... Zum aktuellen Stand der Technik kann ich also nur wenig sagen!

            Gruß
            Jürgen
            Inschrift auf einem sächsisch-preußischen Grenzstein

            Wer hier vorüber geht, verweile!
            Hier läuft ein unsichtbarer Wall.
            Deutschland zerfällt in viele Teile.
            Das Substantivum heißt: Zerfall.

            Was wir hier stehn gelassen haben,
            das ist ein Grabstein, dass ihr's wisst!
            Hier liegt ein Teil des Hunds begraben,
            auf den ein Volk gekommen ist.


            Erich Kästner: Gesang zwischen den Stühlen (1932)

            Kommentar

            • Wimmi
              Heerführer

              • 17.01.2002
              • 1456
              • 51°36'39" N ..... 10°12'55" O

              #7
              OCR und alte Dokumente:

              Egal welche Schrift wir heute verwenden, OCR-Programme haben ein wesentliches Problem : Die Randschärfe !

              Daher gilt:
              -Handschrift :nie
              -Druckschrift : ja, sofern sehr scharf
              -Blaupausen:nee
              -Durchschriften auf Kohlepapierbasis : nein

              Leider immer noch : Abtippen ist die Devise

              Gruß
              Der Wimmi

              Litterarum radices amaras esse, fructus iucundiores

              Das Wissen hat bittere Wurzeln, aber seine Früchte sind umso süßer

              (Diomedes 1, 310, 3.K.)

              Kommentar

              • Wimmi
                Heerführer

                • 17.01.2002
                • 1456
                • 51°36'39" N ..... 10°12'55" O

                #8
                Hallo Eifelgeist:

                Gibt es ein vernünftiges Buch über Sütterlin ?
                Da ich einen Berg von Dokumenten aus dem Zeitraum 1700-1900 hier liegen habe, bräuchte eine Einführung in diese Schrift, bevorzugt Schreibschrift ( Handschrift )

                Gruß identifizierenderweise
                Der Wimmi

                Litterarum radices amaras esse, fructus iucundiores

                Das Wissen hat bittere Wurzeln, aber seine Früchte sind umso süßer

                (Diomedes 1, 310, 3.K.)

                Kommentar

                • Eifelgeist
                  Ehren-Moderator
                  Heerführer

                  • 13.03.2001
                  • 2593
                  • Beute-„Rheinland-Pfälzer“

                  #9
                  Sorry, Wimmi,

                  ich lese das erst jetzt ...

                  Eine Auswahl von Buchtiteln:

                  Die blaue Fibel
                  Leitfaden für die Sütterlin- und die Deutsche Schreibschrift
                  Brune; 2000; ISBN 3-930510-13-8; kartoniert; 48 Seiten
                  6,50 € [D] / 6,70 € [A]

                  Dohna, Berthold zu:
                  Warum nicht mal deutsch?
                  Übungsbuch für die deutsche Schreibschrift
                  Christians; 3. geänderte Auflage 1995; ISBN 3-7672-1241-2; Pappband; 170 Seiten ca. 80 Abbildungen
                  12,80 € [D] / 13,20 € [A]

                  Mayer, Hans:
                  Schön schreiben
                  Übungsheft zum Erlernen der deutschen Schreibschrift für Erwachsene
                  Liliom; 1997; ISBN 3-927966-57-6; geheftet
                  5,00 € [D] / 5,20 € [A]

                  Süß, Harald:
                  Deutsche Schreibschrift
                  Lesen und Schreiben lernen
                  Droemer Knaur; 1995; ISBN 3-426-66753-3; gebunden
                  10,90 €

                  Süß, Harald:
                  Deutsche Schreibschrift
                  Lesen und Schreiben lernen. Übungsbuch
                  Augustus; 1995; ISBN 3-8043-0373-0; kartoniert; 30 Seiten
                  5,50 € [D] / 5,70 € [A] / 9,90 sFr

                  Gruß
                  Eifelgeist
                  Inschrift auf einem sächsisch-preußischen Grenzstein

                  Wer hier vorüber geht, verweile!
                  Hier läuft ein unsichtbarer Wall.
                  Deutschland zerfällt in viele Teile.
                  Das Substantivum heißt: Zerfall.

                  Was wir hier stehn gelassen haben,
                  das ist ein Grabstein, dass ihr's wisst!
                  Hier liegt ein Teil des Hunds begraben,
                  auf den ein Volk gekommen ist.


                  Erich Kästner: Gesang zwischen den Stühlen (1932)

                  Kommentar

                  • Roger

                    #10
                    Harald Süß ist empfehlenswert

                    Mit dem Buch und dem dazugehörenden Übungsheft habe ich über Weihnachten innerhalb von ein, zwei Wochen die Offenbacher Schrift schreiben gelernt ( viele Bereitschaftsdienste :-)). Wenn Du die erst mal beherrschst, ist Sütterlin und Kurrent echt kein Problem mehr.

                    Würde aber mit Offenbacher Schrift anfangen. Und kauf Dir ein kleines Tintenfaß und verschieden breite Federn im Schreibwarenladen, das macht echt Laune.

                    Gruß Roger

                    Kommentar

                    • Wimmi
                      Heerführer

                      • 17.01.2002
                      • 1456
                      • 51°36'39" N ..... 10°12'55" O

                      #11
                      Huch,

                      doch noch eine Antwort.

                      Na, dann werde ich mir mal den "Süß" besorgen und fleissig üben.


                      Danke
                      Der Wimmi

                      Litterarum radices amaras esse, fructus iucundiores

                      Das Wissen hat bittere Wurzeln, aber seine Früchte sind umso süßer

                      (Diomedes 1, 310, 3.K.)

                      Kommentar

                      • Roger

                        #12
                        Meine Arbeitskollegen haben mir unterstellt, ich hätte jetzt eine Brieffreundin im Altersheim... und würde deshalb diese alte Schrift üben....

                        :BUMM

                        Kommentar

                        Lädt...