»Katholische Enzyklopädie«

Gespräche über ausgewählte litterarische Texte.
Benutzeravatar
PaceVeritas
Beiträge: 1007
Registriert: Freitag 13. April 2007, 22:26

Re: Artikel "Traditionalismus" in der Kathpedia

Beitrag von PaceVeritas »

Petra hat geschrieben:Ihr schreibt jetzt alles in neuer Schrift ab, oder? Gibt es dafür keine Programme, die das ruckzuck erledigen?
Im Moment ist das die einzige Möglichkeit ...
Wir sollten vielleicht irgendwo sammeln, wer welche(n) Artikel abtippt, damit es nicht zu Doppelungen kommt.

(Mein Computer bzw. die Internetverbindung schafft es im Moment nicht mal, die pdfs herunterzuladen. Aber sobald ich andernorts "gescheites" Internet habe, werde ich mich ans Werk machen. Eine gesteigerte Schreibgeschwindigkeit als Nebeneffekt ist ja auch nicht übel!)

Das Procedere:
http://kathenzyklo.bplaced.net/faq.html hat geschrieben:Wie kann ich mitmachen?

Wer eine Viertelstunde Zeit und einen Rechner hat, kann mithelfen. Es geht ganz simpel:

1. Beschaffe dir eine Fassung des W&W-Kirchenlexikons (2. Auflage).

Das geht am einfachsten, indem du dir eine der Googleablichtungen im PDF-Format herunterlädst.
http://www.mgh.de/bibliothek/virtueller ... enlexikon/
(...)

2. Suche dir einen Artikel aus, der dich interessiert.

3.Tippe ihn ab.

Mit welchem Programm du ihn abtippst, ist egal. Du kannst ihn direkt in eine E-Mail schreiben oder in MS Word. Am besten aber ist ein einfacher, normaler Texteditor. Wenn im Artikel griechische oder hebräische Buchstaben vorkommen, die du nicht eingeben kannst, merke das an der Stelle im Text kurz an, z. B. mit (GRIECHISCH).

4. Schicke mir den Text (...), ich bearbeite ihn und füge ihn ein.

Quelle
Aber es wurde ja ein Texterkennungsprogramm erwähnt:
Protasius hat geschrieben:Wetzer und Welte's Kirchenlexikon ist nicht nur eingescannt, es ist auch ein Texterkennungsprogramm darüber gelaufen (wenn auch mit den bei Frakturschrift üblichen verbesserungswürdigen Resultaten). Man könnte also - eine Domain vorrausgesetzt - tatsächlich mit halbwegs vertretbarem Aufwand ein wirklich katholisches Wiki erstellen.
Falls jemand sich damit auskennt, und sein Wissen kundtäte, wäre das hervorragend!
» Sic enim dilexit Deus mundum ... «
(Joh. 3,16)
[/color]

Benutzeravatar
lifestylekatholik
Beiträge: 8702
Registriert: Montag 6. Oktober 2008, 23:29

Re: Artikel "Traditionalismus" in der Kathpedia

Beitrag von lifestylekatholik »

PaceVeritas hat geschrieben:
Petra hat geschrieben:Ihr schreibt jetzt alles in neuer Schrift ab, oder? Gibt es dafür keine Programme, die das ruckzuck erledigen?
Im Moment ist das die einzige Möglichkeit ...
Das ist tatsächlich die einzige Möglichkeit. Probleme sind: Der Text ist in Fraktur -- es gibt zwar Frakturerkennungssoftware, die ist aber noch nicht so ausgereift wie die zu Antiqua und außerdem ziemlich teuer. Selbst solche Software braucht -- das ist ein weiteres Problem -- gute, saubere Scans, und sie muss die Orthografie kennen. All das ist bisher bei W&W nicht gegeben.

Selbst wenn all das gegeben ist, geht es immer noch nicht ruckzuck; denn es stecken immer noch so viele Fehler drin, dass man die Ergebnisse korrekturlesen muss. In dem Project Gutenberg Distributed Proofreaders wird jede gescannte und über gute OCR-Software umgewandelte Seite noch von mindestens fünf verschiedenen Menschen durchgecheckt -- und zwar ziemlich akribisch --, bevor man sie rausgibt.

Für mich geht es erfahrungsgemäß schneller und einfacher, Texte abzutippen. Aber wenn jemand es mit einer OCR-Software versuchen will, oder die OCR-Resultate von Google als Grundlage benutzen will (ich glaube, Google nutzt Tesseract, allerdings wahrscheinlich weder die deutsche Anpassung noch das Frakturmodul), kann er das natürlich machen. Wichtig ist ja nur das Ergebnis.
PaceVeritas hat geschrieben:Wir sollten vielleicht irgendwo sammeln, wer welche(n) Artikel abtippt, damit es nicht zu Doppelungen kommt.
Falls sich jemand einen größeren Artikel vornimmt, kann er mich ja anmailen, ich stelle das dann in der Schlagwortliste als »in Arbeit« ein. Solange die Liste noch unter hundert Einträgen hat, dürfte das nicht unübersichtlich werden.
»Was muß man denn in der Kirche ›machen‹? In den Gottesdienſt gehen und beten reicht doch.«

Benutzeravatar
lifestylekatholik
Beiträge: 8702
Registriert: Montag 6. Oktober 2008, 23:29

Re: Artikel "Traditionalismus" in der Kathpedia

Beitrag von lifestylekatholik »

Petra hat geschrieben:Wäre es nicht sinnvoller, bei der kathpedia mitzuarbeiten als für die Tradis eine eigene kathpedia zu schaffen? Oder geht es nur darum, das Lexikon ins Netz zu stellen, read only quasi?
Um mit der letzten Frage zu beginnen: Es geht nur darum, das Lexikon ins Netz zu stellen, read only. -- Wenn dann irgendjemand die Texte weiternutzen kann, z. B. als Grundlage für einen Artikel in der kathpedia, wäre das natürlich ideal.

Damit ist dann eigentlich auch schon der wesentliche Unterschied zur kathpedia angesprochen. Ich denke nicht, dass beide Projekte miteinander konkurrieren (mal abgesehen davon, dass die kathpedia sowieso viel größer ist und da viel mehr Leutchens mitmachen), sondern sie sind unterschiedlich genug.

Übrigens ist die W&W nicht für Tradis. Sie ist schlicht katholisch.
»Was muß man denn in der Kirche ›machen‹? In den Gottesdienſt gehen und beten reicht doch.«

Benutzeravatar
Melody
Beiträge: 4263
Registriert: Mittwoch 22. März 2006, 16:05
Wohnort: in der schönsten Stadt am Rhein... ;-)

Re: Artikel "Traditionalismus" in der Kathpedia

Beitrag von Melody »

@Stylie
Ich finde Dein Projekt großartig und würde gerne mitmachen (Abtippen ist ja jetzt nicht die geistige Überforderung... ;-)), allerdings hab ich grad festgestellt, dass offenbar die meisten der eingescannten Artikel absolut unleserlich sind... entweder komplett hell oder total schwarz...
Ich hab z. B. mal nach "Keuschheit" gesucht, aber da sind viele Dinge nicht lesbar, da in Druckerschwärze versenkt... das ist zwar im Verhältnis zum Gesamtartikel nicht viel, aber es nutzt ja trotzdem nichts, wenn zwischendurch Abschnitte fehlen... :achselzuck: :/
Ewa Kopacz: «Für mich ist Demokratie die Herrschaft der Mehrheit bei Achtung der Minderheitenrechte, aber nicht die Diktatur der Minderheit»

Benutzeravatar
Gamaliel
Beiträge: 8609
Registriert: Donnerstag 22. Januar 2009, 07:32

Re: Artikel "Traditionalismus" in der Kathpedia

Beitrag von Gamaliel »

Melody hat geschrieben:Ich hab z. B. mal nach "Keuschheit" gesucht, aber da sind viele Dinge nicht lesbar, da in Druckerschwärze versenkt... das ist zwar im Verhältnis zum Gesamtartikel nicht viel, aber es nutzt ja trotzdem nichts, wenn zwischendurch Abschnitte fehlen... :achselzuck: :/
Als Alternative bietet sich eine Nachsicht in den hier verlinkten Scans an: http://www.kreuzgang.org/viewtopic.php?p=536985#p536985

Wenn man sich den entsprechenden Band heraussucht (Achtung nur die ersten Suchergebnisse beziehen sich auf die 2. Auflage von W & W!) und dann in der linken Fensterspalte ("View the book") die Option "Read Online" auswählt, dann kann man relativ schnell herausfinden, ob in diesen Scans die Seiten lesbar und somit abtippbar sind.

Benutzeravatar
Juergen
Beiträge: 26999
Registriert: Mittwoch 1. Oktober 2003, 21:43

Re: Artikel "Traditionalismus" in der Kathpedia

Beitrag von Juergen »

lifestylekatholik hat geschrieben:
PaceVeritas hat geschrieben:
Petra hat geschrieben:Ihr schreibt jetzt alles in neuer Schrift ab, oder? Gibt es dafür keine Programme, die das ruckzuck erledigen?
Im Moment ist das die einzige Möglichkeit ...
Das ist tatsächlich die einzige Möglichkeit. Probleme sind: Der Text ist in Fraktur -- es gibt zwar Frakturerkennungssoftware, die ist aber noch nicht so ausgereift wie die zu Antiqua und außerdem ziemlich teuer. Selbst solche Software braucht -- das ist ein weiteres Problem -- gute, saubere Scans, und sie muss die Orthografie kennen. All das ist bisher bei W&W nicht gegeben.
Es gibt zwei OCR-Programme, die auch von "Google Books" genutzt werden.
Eines ist Tessaract: http://code.google.com/p/tesseract-ocr/
das zweite ist OCRopus: http://code.google.com/p/ocropus/

Zumindest für Tesseract gibt es auch eine Fraktur-Bibliothek (unter Linux als Paket: "tesseract-ocr-deu-f" installierbar).
Gruß Jürgen

Dieser Beitrag kann unter Umständen Spuren von Satire, Ironie und ähnlich schwer Verdaulichem enthalten. Er ist nicht für jedermann geeignet, insbesondere nicht für Humorallergiker. Das Lesen erfolgt auf eigene Gefahr.
- Offline -

Benutzeravatar
lifestylekatholik
Beiträge: 8702
Registriert: Montag 6. Oktober 2008, 23:29

Re: Artikel "Traditionalismus" in der Kathpedia

Beitrag von lifestylekatholik »

Juergen hat geschrieben:Es gibt zwei OCR-Programme, die auch von "Google Books" genutzt werden.
Eines ist Tessaract: http://code.google.com/p/tesseract-ocr/
das zweite ist OCRopus: http://code.google.com/p/ocropus/

Zumindest für Tesseract gibt es auch eine Fraktur-Bibliothek (unter Linux als Paket: "tesseract-ocr-deu-f" installierbar).
Ja, hab ich ja zwei Absätze drunter auch geschrieben. Allerdings ist die Qualität der Gugelscans dermaßen bescheiden, dass das erst mal wenig hülft. Da müsste sich jemand hinstellen und neu einskännen.

Du kannst ja mal mit einem Artikel ausprobieren, inwieweit das was bringt. An eine Ausgabe in Buchform kommst du ja wahrscheinlich recht einfach ran. :)
»Was muß man denn in der Kirche ›machen‹? In den Gottesdienſt gehen und beten reicht doch.«

Benutzeravatar
Seraph
Beiträge: 716
Registriert: Mittwoch 9. April 2008, 14:37

Re: Artikel "Traditionalismus" in der Kathpedia

Beitrag von Seraph »

Petra hat geschrieben: Wäre es nicht sinnvoller, bei der kathpedia mitzuarbeiten als für die Tradis eine eigene kathpedia zu schaffen? Oder geht es nur darum, das Lexikon ins Netz zu stellen, read only quasi?
Wenn es ein Wiki sein soll, dann würde ich eher empfehlen, sich bei der Wikipedia einzubringen. Das kann ermüdend sein, bewirkt aber meines Erachtens mehr.
Ein düsterer Seraph möchte wohl selbst den dreieinigen Gott erschrecken.
(Mother Mary Francis)

Benutzeravatar
Juergen
Beiträge: 26999
Registriert: Mittwoch 1. Oktober 2003, 21:43

Re: Artikel "Traditionalismus" in der Kathpedia

Beitrag von Juergen »

lifestylekatholik hat geschrieben:
Juergen hat geschrieben:Es gibt zwei OCR-Programme, die auch von "Google Books" genutzt werden.
Eines ist Tessaract: http://code.google.com/p/tesseract-ocr/
das zweite ist OCRopus: http://code.google.com/p/ocropus/

Zumindest für Tesseract gibt es auch eine Fraktur-Bibliothek (unter Linux als Paket: "tesseract-ocr-deu-f" installierbar).
Ja, hab ich ja zwei Absätze drunter auch geschrieben. Allerdings ist die Qualität der Gugelscans dermaßen bescheiden, dass das erst mal wenig hülft. Da müsste sich jemand hinstellen und neu einskännen.
Ich habe mal einen Band als pdf heruntergeladen und wahllos eine Seite extrahiert und über eine Spalte tesseract laufen lassen.

Bild
(die linke Spalte von dieser Seite)

Das Ergebnis sieht so aus:

Code: Alles auswählen

Theonerben Rabuchodonosor gegen Nechao. Beide
stießen zu Chatcatnis am Cuphrat aus einander
(Ja. 46, 2). Rabuchodonosor blieb Sieger und
zung die Aegypter, Syrien und Palästina vor
ihm zu titusnen. Zu den Fürsten, welche demnach
die Oberhoheit des chaldäischen Herrschers aner-
leuuen mußten, gehörte auch Joatim von Juda
(4 Kun. 24, 1). Raduchodonosor zog in Jeru-
Eui ein. nahm einen Theil der Tempelgesäße an
und sührte mehrere edle Jünglinge, unter denen
auch Daniel war, mit nach Babel. Cr würde seinen
Siegeslaus bis nach Aegypten hinein versolgt haben,
neun die Kunde von Nabopolassars Tode ihn
nicht veranlaßt hatte, nach Babylon zu eilen, um
denThton seiner Dynastie zu sichern. Er selbst
konnte seine Regierungszeit au 43 Jahre aus-
dehnen (64-—562). Ueber diese lange Zeit gibt
es tauur andere Nachrichten als die biblischen,
uselshe sich ai;thdie Geschichte Juda«s beziehen;
denn die von buchodonosor hertilhrenden Keil-
iuschristen reden nur von den großartigen Bauten,
wels er zu Babylon und im gan en babylonischen
Bude ausrichten ließ. Die Hauptstadt erhielt unter
seiner Regierung ein ganz neues Ansehen; neue
Straßen und Stadtviertel wurden inzugesügt,
eine nene Königsburg aus der Ostseite des Cuphrat
errichtet, der Fluß in Mauern gebettet, und die
Stadtmauern wurden derart vergrößert, daß sie
als Weltwunder galten und der Stadt die Un-
uuuehnibarteit zu sichern schienen (s. d. Art. Baby-
lon 1- 1812). Auch das alte Botstppa ward mit
tu den Uuelreis der Stadt gezogen. und bei dieser
Gelegenheit ließ Nabuchodonosor aus den Resten
des uralter: Bann-erles, von dessen Errichtung
Gen. 11, 4 berichtet, den weltberühmten Tempel
Izzelerßjchten (llzöroatö-äl1,kJ81). DasIlingeZ
« gro rtigen au ’ itwares, sna
Dan. 4, 26. 27 den Stolz Habuchodonosors wach
rirs und bs; zu einer empfindlichen Strafe führte.
Das er dieser Gelegenheit auch das zutiins-
tige Geschick Babels vorhergesagt habe, ist spätere
issMdssteAusschneiickung,welcheCusebius(krncp.
tung. 9, 41) aus Megasthenes aufbewahrt hat.
such außerhalb Babylons gab es nach Ausweis der
Zuschriften im ganzen Lande keinen alten Tempel,
deu er nicht versrhönert, wiederhergestellt oder ganz
uu gebaut hätte. Jndein er hiermit das eine
Leheuselersertt dzrckzzcxs-lyloiklör sichße utzd so die
’ nett e «gte, orgte er
sur die andere Cxistenzbedingitnkgedes Reiches durch
ebenso großartige Wasserbauten an den Kanälen
und dem Cuphrat und ließ selbst die User des per-
sischen Meerbusens durch gewaltige Ditmme gegen
vie Sturmstuten sichern. Jn ihren Beziehungen
uch Außen betra tet, war Nabuchodonosors Re-
gierung verhältni mäßig sriedlich. Zum ntiegc
tits ihn ini J. 63 der Absall Joalims in Juda,
der iusssertrauen aus tig tische Unterstützung den
Tridutvenveigerte. NabuI’odonost:;1ellte mitgroßer
henennacht nach Jerusalem und gerte es. Kurz
vorher warzoakim gestorben mid dessen erst 18jäh-·
Taugt also bestensfalls etwas als Arbeitsgrundlage, um es dann von Hand zu verbessern.
Gruß Jürgen

Dieser Beitrag kann unter Umständen Spuren von Satire, Ironie und ähnlich schwer Verdaulichem enthalten. Er ist nicht für jedermann geeignet, insbesondere nicht für Humorallergiker. Das Lesen erfolgt auf eigene Gefahr.
- Offline -

Benutzeravatar
taddeo
Moderator
Beiträge: 19226
Registriert: Donnerstag 18. Januar 2007, 09:07

Re: Artikel "Traditionalismus" in der Kathpedia

Beitrag von taddeo »

Klingt stellenweise wie die Spammails der Nigeria-Connection, die mir alle paar Tage zig Millionen andrehen wollen ... :irritiert:

Benutzeravatar
Gamaliel
Beiträge: 8609
Registriert: Donnerstag 22. Januar 2009, 07:32

Re: Artikel "Traditionalismus" in der Kathpedia

Beitrag von Gamaliel »

lifestylekatholik hat geschrieben:Du kannst ja mal mit einem Artikel ausprobieren, inwieweit das was bringt.
Also ich bin mit den von mir erzielten Ergebnissen zufrieden und werde "Tesseract" benutzen. Wenn die Vorlage nicht gar zu korrumpiert ist, dann scannt das Programm gut und es schleichen sich nur wenige Fehler (überwiegend "ä" und "ü" Probleme und einige zusätzliche Abstände) ein. Diese Fehler auszubessern geht (bei mir) deutlich schneller, als den Text abzutippen.

Benutzeravatar
Juergen
Beiträge: 26999
Registriert: Mittwoch 1. Oktober 2003, 21:43

Re: »Katholische Enzyklopädie«

Beitrag von Juergen »

Das Problem scheinen in der Tat die schlechten Google-Scans zu sein und nicht unbedingt die Texterkennungssoftware (man bedenke, daß "Tessaract" kostenlos ist und kein teures OCR-Programm).

Ich habe gerade mal eine Seite eines Buches, das in Fraktur geschrieben ist, auf den Scanner gelegt und mit 300dpi gescannt. Danach habe ich daraus ein S/W-Bild gemacht und dann Tessaract drüber laufen lassen.

Ich finde, daß das durchaus ein "gutes" Ergebnis gibt.
Staates gegenüber der heiligen Kirche. Der Amtmann erteilte dem Polizeidiener
' Christiani Befehl, die Instrumente zum Aufbrechen der Schranktüren aus der Amtsstube
zu holen. — —
Aber ein anderer Wille brach sich durch. Der Polizeidiener Christiani erklärte in
aller Form und Bestimmtheit: ,,Herr Amtmann, ich lege hierdurch meinen Dienst als
Polizeidiener nieder.« Er zog seinen bunten Rock aus und entfernte sich sogleich.
Der Schrank wurde durch die Gendarmerie erbrochen, und die Konfiszierung der
pfarramtlichen Akten erfolgte. ——— ——
Jndessen hatte sich eine große Volksmenge auf dem Kirchhofe vor der Pastorat
angesammelt, gespannt auf das Schauspiel wartend. Von dem Fenster der Pastorat aus
bemerkte der Amtmann die Ansammlung. Er schickte den Gendarm herunter, den
Platz zu räumen. Aber die Menge wich nicht. Nun gelang es einem der Geistlichen,
die Versammelten zum ruhigen Auseinandergehen zu bitten. Die Menge antwortete mit
begeisterten Hochrufen auf Se. Heiligkeit den Papst. Die Stimmung war so erregt,
sagt die Quelle, daß weitere derartige Bitten für den Augenblick fruchtlos erscheinen
mußten. P
Endlich jedoch gelang es dem Zureden der beiden Geistlichen, daß der größte Teil
der Harrenden den Kirchplatz verließ.
Es soll gegen 34 10 Uhrabends gewesen sein, als die Staatsaktion beendet war und
der Amtmann sich in seine Wohnung verfügt habe.
Noch längere Zeit nachher zogen einzelne Trupps die Straßen auf und ab, die
sich durch lautes Rufen bemerkbar machten und ihren Unwillen über die Tat des Amt-
manns, ihre Sympathie aber über die Tat ihres Polizeidieners kundtaten. Dazwischen
ertönten von nah und fern Böllerschüsse, und es muß eine lustige Knallerei an diesem
Juniabend in Balve gewesen sein. Die Jllumination zu Ehren des Papstes wurde nun
doch veranstaltet, und die Zeit soll auf Mitternacht gerückt sein, bis die Straßen langsam
sich leerten.
Der Chronist berichtet zum Schluß:
,,Am anderen Morgen hörte man leider von einigen bedauerlichen Seenen; einige
Scheiben in der Wohnung des Amtmanns waren durch Steinwürfe zertrümmert, und
es fand sich in der Wand eines Zimmers auch eine Kugel vor. Die Bewohner von
Balve weisen mit Entrüstung die Vermutung zurück, daß die Kugel von hiesigen Ein-
wohnern abgeschossen sei . . .«
Wir wollen es dahingestellt sein lassen, ob der Bericht frei von persönlichen Ein-
stellungen ist. Die Gegenstimmen konnten nicht ausbleiben. Jn der Tat erfolgte auch
einige Tage nachher eine ,,Berichterstattung« über die Angelegenheit in dem ,,Soester
Kreisblatt«, die den »,,amtlichen« Standpunkt wahrte. Es ist nicht uninteressant, auch
diese zu lesen. 1) Danach wurde ,,trotz des polizeilichen Verbots die ganze Nacht hin-
durch geschossen.« ,,Die Störung der nächtlichen Ruhe durch fortwährendes Kanonieren
veranlaßten den Amtmaun Schlüter, nachts 341 Uhr aufzustehen und energisch diesem
Gruß Jürgen

Dieser Beitrag kann unter Umständen Spuren von Satire, Ironie und ähnlich schwer Verdaulichem enthalten. Er ist nicht für jedermann geeignet, insbesondere nicht für Humorallergiker. Das Lesen erfolgt auf eigene Gefahr.
- Offline -

Benutzeravatar
PaceVeritas
Beiträge: 1007
Registriert: Freitag 13. April 2007, 22:26

Re: »Katholische Enzyklopädie«

Beitrag von PaceVeritas »

Kurze Frage: Soll eigentlich die Rechtschreibung bei Wörtern wie "überdieß", "Theil", "Nothwendigkeit", usw. erhalten bleiben oder darf sie aktualisiert werden?
» Sic enim dilexit Deus mundum ... «
(Joh. 3,16)
[/color]

Benutzeravatar
PaceVeritas
Beiträge: 1007
Registriert: Freitag 13. April 2007, 22:26

Re: Artikel "Traditionalismus" in der Kathpedia

Beitrag von PaceVeritas »

Melody hat geschrieben: (...) allerdings hab ich grad festgestellt, dass offenbar die meisten der eingescannten Artikel absolut unleserlich sind... entweder komplett hell oder total schwarz...
Juergen hat geschrieben:Das Problem scheinen in der Tat die schlechten Google-Scans zu sein und nicht unbedingt die Texterkennungssoftware
Das musste ich auch feststellen ... eine Seite ist perfekt lesbar, die nächste das Gegenteil - :motz:
Jetzt muss ich mal mehrere Versionen vergleichen, sonst komm ich da nicht weiter.
» Sic enim dilexit Deus mundum ... «
(Joh. 3,16)
[/color]

Benutzeravatar
Melody
Beiträge: 4263
Registriert: Mittwoch 22. März 2006, 16:05
Wohnort: in der schönsten Stadt am Rhein... ;-)

Re: »Katholische Enzyklopädie«

Beitrag von Melody »

PaceVeritas hat geschrieben:Kurze Frage: Soll eigentlich die Rechtschreibung bei Wörtern wie "überdieß", "Theil", "Nothwendigkeit", usw. erhalten bleiben oder darf sie aktualisiert werden?
Das hatte ich mich auch schon gefragt.
Ich würde aber die alte Rechtschreibung beibehalten, sonst macht jeder, was er für richtig hält, und am Ende gibt es ein großes Durcheinander?! :achselzuck:
Ewa Kopacz: «Für mich ist Demokratie die Herrschaft der Mehrheit bei Achtung der Minderheitenrechte, aber nicht die Diktatur der Minderheit»

Benutzeravatar
lifestylekatholik
Beiträge: 8702
Registriert: Montag 6. Oktober 2008, 23:29

Re: »Katholische Enzyklopädie«

Beitrag von lifestylekatholik »

PaceVeritas hat geschrieben:Kurze Frage: Soll eigentlich die Rechtschreibung bei Wörtern wie "überdieß", "Theil", "Nothwendigkeit", usw. erhalten bleiben oder darf sie aktualisiert werden?
Rechtschreibung wie im Original. Wir kämen sonst in Teufels Küche, wie Melody schon geschrieben hat.

(Typographische Spielereien sollen natürlich nicht beibehalten werden, also: Langes S bitte durch rundes S ersetzen, ebenso (in deutschen Wörtern) Ae, Oe und Ue durch Ä, Ö und Ü.)
PaceVeritas hat geschrieben:eine Seite ist perfekt lesbar, die nächste das Gegenteil - :motz:
Jetzt muss ich mal mehrere Versionen vergleichen, sonst komm ich da nicht weiter.
Ja, die Scans sind mies. Glücklicherweise wurden die Bände mehrmals unabhängig voneinander eingeskännt, sodass ich bisher immer eine lesbare Fassung gefunden habe.
»Was muß man denn in der Kirche ›machen‹? In den Gottesdienſt gehen und beten reicht doch.«

Benutzeravatar
Marion
Beiträge: 8698
Registriert: Donnerstag 21. Mai 2009, 18:51
Kontaktdaten:

Re: Artikel "Traditionalismus" in der Kathpedia

Beitrag von Marion »

Gamaliel hat geschrieben:
lifestylekatholik hat geschrieben:Du kannst ja mal mit einem Artikel ausprobieren, inwieweit das was bringt.
Also ich bin mit den von mir erzielten Ergebnissen zufrieden und werde "Tesseract" benutzen. Wenn die Vorlage nicht gar zu korrumpiert ist, dann scannt das Programm gut und es schleichen sich nur wenige Fehler (überwiegend "ä" und "ü" Probleme und einige zusätzliche Abstände) ein. Diese Fehler auszubessern geht (bei mir) deutlich schneller, als den Text abzutippen.
Vor allem die lateinischen Begriffe, da sie in einer anderen Schrift abgebildet sind kommen komplett falsch raus.

Gestern hab ich abgetippt, heute mit tesseract als Vorlage gearbeitet.
Schneller ging es glaube ich nicht, aber irgendwie ist es gemütlicher.
Christus vincit - Christus regnat - Christus imperat

Benutzeravatar
PaceVeritas
Beiträge: 1007
Registriert: Freitag 13. April 2007, 22:26

Re: Artikel "Traditionalismus" in der Kathpedia

Beitrag von PaceVeritas »

Melody hat geschrieben:Ich würde aber die alte Rechtschreibung beibehalten, sonst macht jeder, was er für richtig hält, und am Ende gibt es ein großes Durcheinander?! :achselzuck:
lifestylekatholik hat geschrieben:Rechtschreibung wie im Original. Wir kämen sonst in Teufels Küche, wie Melody schon geschrieben hat.

(Typographische Spielereien sollen natürlich nicht beibehalten werden, also: Langes S bitte durch rundes S ersetzen, ebenso (in deutschen Wörtern) Ae, Oe und Ue durch Ä, Ö und Ü.)

Alles klar! Werde mich dran halten.


Marion hat geschrieben:Gestern hab ich abgetippt, heute mit tesseract als Vorlage gearbeitet.
Schneller ging es glaube ich nicht, aber irgendwie ist es gemütlicher.
Werde das Programm mal bei Gelegenheit probieren.
Wenn man ein gut lesbares Bild vorliegen hat, geht das Übertragen aber sehr schnell und macht Spaß!
» Sic enim dilexit Deus mundum ... «
(Joh. 3,16)
[/color]

Benutzeravatar
Marion
Beiträge: 8698
Registriert: Donnerstag 21. Mai 2009, 18:51
Kontaktdaten:

Re: Artikel "Traditionalismus" in der Kathpedia

Beitrag von Marion »

Gamaliel hat geschrieben:
Melody hat geschrieben:Ich hab z. B. mal nach "Keuschheit" gesucht, aber da sind viele Dinge nicht lesbar, da in Druckerschwärze versenkt... das ist zwar im Verhältnis zum Gesamtartikel nicht viel, aber es nutzt ja trotzdem nichts, wenn zwischendurch Abschnitte fehlen... :achselzuck: :/
Als Alternative bietet sich eine Nachsicht in den hier verlinkten Scans an: http://www.kreuzgang.org/viewtopic.php?p=536985#p536985

Wenn man sich den entsprechenden Band heraussucht (Achtung nur die ersten Suchergebnisse beziehen sich auf die 2. Auflage von W & W!) und dann in der linken Fensterspalte ("View the book") die Option "Read Online" auswählt, dann kann man relativ schnell herausfinden, ob in diesen Scans die Seiten lesbar und somit abtippbar sind.
Lifestyle, kannst du diese Ersatzlinks auch auf dem Katzenklo veröffentlichen?
Christus vincit - Christus regnat - Christus imperat

Benutzeravatar
PaceVeritas
Beiträge: 1007
Registriert: Freitag 13. April 2007, 22:26

Re: Artikel "Traditionalismus" in der Kathpedia

Beitrag von PaceVeritas »

Marion hat geschrieben:(...)Ersatzlinks auch auf dem Katzenklo veröffentlichen?
Hat jetzt etwas gedauert, von "Katzenklo" auf "Kathenzyklo" zu kommen ...
Etwas mehr Ehrfurcht bitte! ;)
:breitgrins:

Sehr guter Vorschlag, das mit den Ersatzlinks!
» Sic enim dilexit Deus mundum ... «
(Joh. 3,16)
[/color]

Benutzeravatar
PaceVeritas
Beiträge: 1007
Registriert: Freitag 13. April 2007, 22:26

Re: »Katholische Enzyklopädie«

Beitrag von PaceVeritas »

Kleine Anekdote:
Die erste Seite, die ich aufgerufen habe, war der hl. Abbo von Fleury.

Das [Streber.] unter dem Artikel fasste ich zuerst als kleinen Scherz von lifestyle auf.
Als dann bei Abbo Cernuus [Gams.], bei Aachen [Floß.] und bei Biret [Stahl.] kam, dämmerte es, dass die Verfasser gemeint sind. :tuete:
» Sic enim dilexit Deus mundum ... «
(Joh. 3,16)
[/color]

Benutzeravatar
PaceVeritas
Beiträge: 1007
Registriert: Freitag 13. April 2007, 22:26

Re: »Katholische Enzyklopädie«

Beitrag von PaceVeritas »

Könnte bitte jemand, der des Griechischen mächtig ist, aus dem Artikel "Gebet" die griechischen Begriffe hier eingeben? Wäre zu großem Dank verpflichtet!

Es handelt sich um folgende Stellen (Bild einstellen funktioniert gerade leider nicht):

Band 5, S. 89 (pdf) bzw. S. 129 (Buch) - (die Stellen befinden sich am Anfang des Artikels, folgen dicht aufeinander)

- Joh. Damasc. De fid. orth. 3, 26: (GRIECHISCH)
- (darum „oratio“; Chrys. Hom. 30 in Genes. n. 5: GRIECHISCH)
- die „Erhebung des Geistes zu Gott hin“ (GRIECHISCH)

S. 91 (pdf), S. 133 (Buch), unteres Drittel der Seite

- Eusebius (Praep. Evang. 13, 11) bezeichnet die letztere als eine vernünftige Sitte (GRIECHISCH)
» Sic enim dilexit Deus mundum ... «
(Joh. 3,16)
[/color]

Benutzeravatar
Marion
Beiträge: 8698
Registriert: Donnerstag 21. Mai 2009, 18:51
Kontaktdaten:

Re: »Katholische Enzyklopädie«

Beitrag von Marion »

PaceVeritas hat geschrieben:(Bild einstellen funktioniert gerade leider nicht)
da kann ich einspringen :)
Bild

Bild
Christus vincit - Christus regnat - Christus imperat

Benutzeravatar
lifestylekatholik
Beiträge: 8702
Registriert: Montag 6. Oktober 2008, 23:29

Re: »Katholische Enzyklopädie«

Beitrag von lifestylekatholik »

PaceVeritas hat geschrieben:Das [Streber.] unter dem Artikel fasste ich zuerst als kleinen Scherz von lifestyle auf.
Als dann bei Abbo Cernuus [Gams.], bei Aachen [Floß.] und bei Biret [Stahl.] kam, dämmerte es, dass die Verfasser gemeint sind. :tuete:
Du hast das Vorwort nicht gelesen! :dudu:
PaceVeritas hat geschrieben:Könnte bitte jemand, der des Griechischen mächtig ist, aus dem Artikel "Gebet" die griechischen Begriffe hier eingeben? Wäre zu großem Dank verpflichtet!
(Es würde auch reichen, wenn du an den Stellen einfach nur eine Markierung setzt, sodass ich es dann ergänzen kann. Beim Lesen übrigens Achtung, ich habe schon zwei Stigmas (Stigmata?) gefunden.)
»Was muß man denn in der Kirche ›machen‹? In den Gottesdienſt gehen und beten reicht doch.«

Benutzeravatar
PaceVeritas
Beiträge: 1007
Registriert: Freitag 13. April 2007, 22:26

Re: »Katholische Enzyklopädie«

Beitrag von PaceVeritas »

@ Marion: Vielen Dank für das Heraussuchen und Einstellen der Textstellen! :)

lifestylekatholik hat geschrieben:Du hast das Vorwort nicht gelesen! :dudu:
Das hab ich tatsächlich erst nachher gelesen... wie gesagt, ganz unsystematisch wurde erst mal spontan der Abbo von Fleury aufgerufen. Die Existenz des guten Dr. Streber wurde erst später offenbar!
lifestylekatholik hat geschrieben:Es würde auch reichen, wenn du an den Stellen einfach nur eine Markierung setzt, sodass ich es dann ergänzen kann.
Ok, dann werde ich das in Zukunft so handhaben. Vermeidet viel Aufwand! :daumen-rauf:
lifestylekatholik hat geschrieben:Beim Lesen übrigens Achtung, ich habe schon zwei Stigmas (Stigmata?) gefunden.)
Wie darf man das verstehen? (Sorry, ist spät)
Fehler im Artikel? Hab ich was falsch abgeschrieben?
» Sic enim dilexit Deus mundum ... «
(Joh. 3,16)
[/color]

Benutzeravatar
lifestylekatholik
Beiträge: 8702
Registriert: Montag 6. Oktober 2008, 23:29

Re: »Katholische Enzyklopädie«

Beitrag von lifestylekatholik »

PaceVeritas hat geschrieben:
lifestylekatholik hat geschrieben:Beim Lesen übrigens Achtung, ich habe schon zwei Stigmas (Stigmata?) gefunden.)
Wie darf man das verstehen? (Sorry, ist spät)
Fehler im Artikel? Hab ich was falsch abgeschrieben?
Nee, der griechische Buchstabe: ϛ; kommt zum Beispiel als vierter Buchstabe in deinem ersten Beispiel vor.

Zum Eingeben einzelner griechischer Wörter benutze ich diesen Griechischkonverter.
»Was muß man denn in der Kirche ›machen‹? In den Gottesdienſt gehen und beten reicht doch.«

Benutzeravatar
lifestylekatholik
Beiträge: 8702
Registriert: Montag 6. Oktober 2008, 23:29

Re: Artikel "Traditionalismus" in der Kathpedia

Beitrag von lifestylekatholik »

PaceVeritas hat geschrieben:Aber es wurde ja ein Texterkennungsprogramm erwähnt: [...]

Falls jemand sich damit auskennt, und sein Wissen kundtäte, wäre das hervorragend!
Gamaliel war so freundlich eine kurze Anleitung für OCR mit Tesseract zu schreiben, die ich hier entsprechend einem Vorschlag Gamaliels einstelle, damit gegebenenfalls Verbesserungs- oder Alternativvorschläge gemacht werden können. Später werde ich sie auf die Katzenkloseite stellen. (Der Vorschlag »Katzenklo« stammt von Gugel.)
Gamaliel hat geschrieben:Verwendung der OCR-Software Tesseract

(Nachstehende Beschreibung bezieht sich auf die Verwendung unter Windows)


Tesseract – Installation unter Windows


A) Benötigte Dateien herunterladen

1. Hauptprogramm
tesseract-ocr-setup-3.00.exe

2. Datensatz zur Erkennung von Frakturschrift
deu-frak.traineddata.gz


B) Installation

1. Setup des Hauptprogramms ausführen (Doppelklick auf „tesseract-ocr-setup-3.00.exe“)

2. Den Datensatz zur Erkennung von Frakturschrift in das automatisch angelegte Hauptverzeichnis von Tesseract kopieren (normalerweise: C:\Programme\Tesseract-OCR) und dort entpacken.
(Die entpackte Datei „deu-frak.traineddata“ muß sich danach im Tesseract-OCR Unterordner „tessdata“ befinden.)



Tesseract – Anwendung unter Windows


A) Voraussetzungen

1. Tesseract scannt nur tif/tiff-Dateien => der zu scannende Frakturtext muß folglich in einer tif-Datei vorliegen

2. Wie bringt man den in einer pdf-Datei vorliegenden Text in eine tif-Datei?

Eine Möglichkeit besteht darin mittels des „Schnappschuss-Werkzeugs“ des Adobe Readers eine Kopie der zu scannenden Textspalte zu erstellen.
(Die Auflösung des Schnappschusses kann im Adobe Reader unter Bearbeiten => Voreinstellungen => Allgemein: „Feste Auflösung für Bilder des Schnappschuß-Werkzeugs verwenden“ eingestellt werden. Mind. 300 Pixel/Zoll erscheinen mir als ratsam.)

3. Ist der Schnappschuß erstellt, kann er z.B. im Windows Standardzeichenprogramm „Paint“ eingefügt und dann unter Auswahl des tif-Dateiformats abgespeichert werden.

4. Diese neuerstellte tif-Datei muß in das Hauptverzeichnis von Tesseract gespeichert/kopiert werden, also nach C:\Programme\Tesseract-OCR


B) Anwendung

1. Das Programm wird über die DOS- Eingabeaufforderung bedient
(Windows: Start => Alle Programme => Zubehör => Eingabeaufforderung)

2. Dort muß man (mittels DOS-Befehlen) ins Installationsverzeichnis des Programms wechseln, also nach C:\Programme\Tesseract-OCR

3. Die einzugebende Befehlszeile zum scannen besteht aus 4 Elementen:

a) dem Programmnamen (tesseract.exe)
b) dem Dateinamen der zu scannenden tif-Vorlage (z.B. scan.tif)
c) dem Dateinamen der gewünschten txt-Datei, die das Scannergebnis beinhalten wird (z.B. test)
d) dem zu verwendenden Schriftdatensatz (-l deu-frak)

Der gesamte einzutippende Befehl lautet demnach für die angeführten Beispielnamen:

tesseract.exe scan.tif test -l deu-frak

4. Wichtig: Tesseract scannt nur tif-Dateien, die sich im Hauptverzeichnis (C:\Programme\Tesseract-OCR) befinden!


Weitere Infos, etwa zu weiteren Befehlen, um mehrere tif-Dateien auf einmal zu scannen findet man z.B. hier.
»Was muß man denn in der Kirche ›machen‹? In den Gottesdienſt gehen und beten reicht doch.«

Benutzeravatar
Marion
Beiträge: 8698
Registriert: Donnerstag 21. Mai 2009, 18:51
Kontaktdaten:

Re: Artikel "Traditionalismus" in der Kathpedia

Beitrag von Marion »

PaceVeritas hat geschrieben:Sehr guter Vorschlag, das mit den Ersatzlinks!

super lifestylekatholik :daumen-rauf:
Christus vincit - Christus regnat - Christus imperat

Benutzeravatar
Juergen
Beiträge: 26999
Registriert: Mittwoch 1. Oktober 2003, 21:43

Re: »Katholische Enzyklopädie«

Beitrag von Juergen »

Anleitung für Linux:

Installation
Am einfachsten mit einem Paketmanager. Die gängigen Distributionen stellen tesseract bereit. Ich würde raten sowohl das normale deutsche als auch das Frakturpaket zu installiern Also:
aptitude install tesseract-ocr tesseract-ocr-deu tesseract-ocr-deu-f

Wer eine graphische Benutzerorberfläche haben will, kann das Programm OCRFeeder installieren. Das unterstützt Tesseract (und GOCR).
aptitude install ocrfeeder

Aufruf
Terminal öffnen und in das Verzeichnis gehen, in dem die Bilddateien liegen. Der Aufruf ist (fast) der gleiche wie bei der Windowsversion:

Beispiel:
Bilddatei: scan.tif
Ausgabedatei: test
Sprachdatei: deu-f (für Fraktur) oder deu (für normale Schrift)

tesseract.exe scan.tif test -l deu-f

Ansonsten die Manpage zu Rate ziehen!

(Wie man unter Linux scannt, muß ich wohl nicht erklären - oder? Nee woll! Wer Linux hat, wird das eh' wissen.)

OCRFeeder
Standardmäßig wird bei dem Programm keine Sprachdatei für Tesseract ausgewählt. Das muß man ändern.
Auf "Werkzeuge" klicken
Dort auf "OCR-Anwendungen"
"Tesseract" anklicken und auf "Bearbeiten" klicken.

Bei "Argumente für die Anwendung" steht standardmäßig: $IMAGE $FILE; cat $FILE.txt
Hinter dem ersten "$FILE" fügt man das Argument für die Sprache ein: $IMAGE $FILE -l deu-f; cat $FILE.txt

Man kann auch für jede Sprache mit "Hinzufügen" eine eigene Tesseractdefinition eingeben. So braucht es es nur - je nach gescanntem Bild/Sprache/Schrift - auswählen.
Gruß Jürgen

Dieser Beitrag kann unter Umständen Spuren von Satire, Ironie und ähnlich schwer Verdaulichem enthalten. Er ist nicht für jedermann geeignet, insbesondere nicht für Humorallergiker. Das Lesen erfolgt auf eigene Gefahr.
- Offline -

Benutzeravatar
Hubertus
Beiträge: 15231
Registriert: Montag 3. Mai 2010, 20:08

Re: »Katholische Enzyklopädie«

Beitrag von Hubertus »

Sollten nicht vllt. die Spalten mitangegeben werden? Das wäre ja leicht auch im Artikel zu bewerkstelligen, wenn diese z.B. in eckigen Klammern in den Text eingefügt würden (also jeweils vor dem Wort, das in dieser jeweiligen Spalte das erste ist, z.B. "in den [899] Himmel"). Dann wäre das ganze zitabel ...
Der Kult ist immer wichtiger als jede noch so gescheite Predigt. Die Objektivität des Kultes ist das Größte und das Wichtigste, was unsere Zeit braucht. Der Alte Ritus ist der größte Schatz der Kirche, ihr Notgepäck, ihre Arche Noah. (M. Mosebach)

Benutzeravatar
Niels
Beiträge: 24027
Registriert: Donnerstag 2. Oktober 2003, 11:13

Re: »Katholische Enzyklopädie«

Beitrag von Niels »

Gute Idee! :daumen-rauf:
(Das ist ja durchaus üblich.)
Iúdica me, Deus, et discérne causam meam de gente non sancta

Benutzeravatar
lifestylekatholik
Beiträge: 8702
Registriert: Montag 6. Oktober 2008, 23:29

Re: »Katholische Enzyklopädie«

Beitrag von lifestylekatholik »

Hubertus hat geschrieben:Sollten nicht vllt. die Spalten mitangegeben werden? Das wäre ja leicht auch im Artikel zu bewerkstelligen, wenn diese z.B. in eckigen Klammern in den Text eingefügt würden (also jeweils vor dem Wort, das in dieser jeweiligen Spalte das erste ist, z.B. "in den [899] Himmel"). Dann wäre das ganze zitabel ...
Wozu?
»Was muß man denn in der Kirche ›machen‹? In den Gottesdienſt gehen und beten reicht doch.«

Antworten Vorheriges ThemaNächstes Thema