• Jetzt anmelden. Es dauert nur 2 Minuten und ist kostenlos!

HTML to Text tool

Werbung:
Danke für das Feedback!

Es gibt zwei Hauptanwendungsgebiete:

1) Eliminierung von Redundanz sowie Einführung neuer Tags
2) SEO

Was meinen denn andere?

Lg
 
Werbung:
genau, das ist eine Möglichkeit:
- neue Tags einführen als Abkürzung, wie im Beispiel das neue Tag o! für einen Button.

Man kann auch einen ganzen Block substituieren, wie in dem Beispiel:

HTML to Text - Tool introduction

...mit dem footer gemacht.
(da steckt sogar der Google Analytics Code drinnen)

Habe den Titel gerade etwas geändert um klarzumachen, das SEO nicht unbedingt die Hauptsache ist...

Sonst noch Anregungen?

Danke und Lg
 
1) Eliminierung von Redundanz sowie Einführung neuer Tags

Bei ersterem gehe ich mit, aber das sollte ein HTML-Kodierer bereits selbst erledigen wenn er den HTML-Code verfasst. Letzteres ist Unsinn, da keine Maschine die Bedeutung dieser neuen Tags ermessen und somit die Inhalte nicht semantisch bewerten kann.


Das hat mit SEO nichts zu tun, da es sich um eine Verkrüppelung des HTML-Codes handelt den Suchmaschinen, wie bei meiner Antwort zu 1) beschrieben, nicht richtig auslesen und bewerten können.
 
Werbung:
Danke für die Antwort threadi!

Mir ist klar geworden, aus Diskusssionen anderswo und hier auch, dass nicht klar wird,
was das Ganze soll - Du hast recht. Deswegen habe ich mich bemüht, eine neue Page
zu erzeugen, die das klarer machen soll:

HTML to Text - Aim - Strategic purpose

Was meint Ihr, wird das da besser deutlich?

Das Hauptziel ist die Eliminierung von Redundanz in HTML über eine Site hinweg.
Was SEO angeht, so habe ich schon mal vor Jahren einen positiven Effekt beobachten
können. (Aber das soll nicht die Hauptsache sein)

HTML to Text - History

Lg
 
Hallo Leute,

viel Zeit ist vergangen. Viel hat sich getan.
Das Tool ist gereift.

Um nur ein Anwendungsbeispiel herauszugreifen, vielleicht das Wichtigste:

Ihr kennt vielleicht das alte "nofollow", was nicht mehr funktioniert wie in alten Zeiten... z.B.:

<a href="http://www.facebook.com" rel="nofollow">Facebook Home</a>

Ziel vom alten "nofollow" war aus Webmaster-Sicht, keinen Link Juice zu vererben, oder auch zu vermeiden, dass der Link gespidert wird.
Das funktioniert nicht mehr, aufgrund einer Algorithmus-Änderung von Google
s. New HTML tags - "nofollow alternative"

Stattdessen kann man mit obigem Tool folgendes schreiben:

a! Willkommen bei Facebook - anmelden, registrieren oder mehr erfahren Facebook Home

... was per DOM Manipulation im Hintergrund umgeschrieben wird zu:

<a href="http://www.facebook.com/">Facebook Homepage</a>

Der User erlebt also einen echten Link mit vollem Look & Feel, der auch per Stylesheet angesprochen werden kann.

Das ist z.B. dem folgendem JavaScript Workaround überlegen:

<span onclick="javascipt::location=...">Facebook Home</span>

... der mir mal als andere Alternative vorgeschlagen wurde.

Der Text: a! Willkommen bei Facebook - anmelden, registrieren oder mehr erfahren Facebook Home
kann niemals von einer Suchmaschine als echter Link erkannt werden und vererbt daher garantiert keinen Link Juice.

Was meint Ihr dazu (positiv oder negativ)?

Bitte siehe: New HTML tags - "nofollow alternative" -> ohne html.txt


Liebe Grüße
 
Werbung:
Ich finde es Unsinnig, darüber nachzudenken, was andere davon halten. Mach was draus und biete das ganze als Download (z.B. sourceforge) an und du wirst sehen, wie die Leute darauf reagieren.
Finde Leute, die mit dir zusammen am Projekt arbeiten und dann wird das schon was, oder eben auch nicht.
 
Hallo Ihr beiden,

Danke für Euer Feedback. Ich weiß es zu schätzen und brauche es auch, um das Tool
zu verbessern.

Die Site New HTML tags stellt den Download auf der Homepage zur Verfügung.
Ich will es nicht komplett "Open Source" machen.
Die Lizenz ist auch auf der Homepage zu sehen - sie ist sehr legere.

Es soll sich um zusätzliche Tags handeln, die nicht standardmäßig in HTML zur Verfügung stehen,
teilweise möglichst komplexe Tags.

Die JavaScript-disabling Geschichte ist eine Limitierung des Tools - die größte Limitierung.
Ich habe dazu eine Unterseite angelegt:

- New HTML tags - Limits

Fragen:

- Wieviele User disablen JavaScript?
- Es handelt sich dabei doch i.d.R. um fortgeschrittene User, oder?
- Was passiert wenn ein solcher User sieht, dass die Seite JavaScript braucht.
Er schaltet sicherlich JS wieder ein, oder?

Sicherlich die größte Limitierung, ja...

Gibt es sonst noch Anregungen?


Liebe Grüße
 
Werbung:
Üblicherweise werden solche Ersetzungen (eigener Tag → tatsächlicher HTML-Code) serverseitig durchgeführt, bevor die fertige Seite an den Browser ausgeliefert wird.

Da bliebe als nützliche Anwendung noch das Suchmaschinen-Ausgetrickse. Dafür mag es sinnvolle Anwendungen geben, aber spontan kann ich dazu nur sagen: Wenn du etwas verlinken willst, setze einen Link.

PS: Weil ich weiß, wie solche Posts üblicherweise ankommen: Ich kritisiere nicht deine Leistung, meiner Meinung nach bist du aber mit der Umsetzung auf dem falschen Dampfer.
 
mermshaus - Du bist fit!
Soviel merke ich...
Und so eine schnelle Antwort!

Was kann ich besser machen?

Im Grunde will ich nur das "Versprechen" von XML, neue Tags zu liefern, wahrmachen.

Ich meine es so - angeblich brauch man sich "nur" mit der DTD zu beschäftigen, und dann klappt's.
Aber wieviele Leute - inklusive Unternehmen - machen das?

Weißt was ich meine?

*Was kann ich besser machen?*


Liebe Grüße, Arvind.
 
Werbung:
Hallo mermshaus,

Danke für die weiteren Anregungen!

Primäres Ziel meines Tools war aber schon immer, die Redundanz im ge-servten HTML Code zu minimieren...
Also im Mid-Tier sind dann praktisch die Abkürzungen bereits zu sehen.
(Der Mid-Tier ist sozusagen entlastet)

Es soll dabei keine Konkurrenz zu PHP o.ä. sein, sondern eine Ergänzung.

(Du kennst vielleicht die Spezial-Tags von Standardanbietern, wie Facebook oder Google Plus,
die auch auf meiner Site zu sehen sind. Das geht in die gleiche Richtung, und die benötigen auch zum Aufspannen
dieses Effekts JavaScript)

Was hälst Du denn von der Google-Analytics Abkürzung?
(s. New HTML tags - Tool introduction -> "Include GA with Style")
Macht das nicht die Routine arbeitet viel einfacher und entlastet den Mid-Tier gewaltig?


Danke nochmal für Dein großartiges Feedback und liebe Grüße
 
Hallo mermshaus,

vielleicht kann man es noch kürzer auf den Punkt bringen:

Ich will die Redundanz im geservten HTML Code weiter minimieren:

New HTML tags - Aim - Strategic purpose (s. "Eliminate redundancy")

--------------
Die Früchte sind im Bereich SEO zu spüren (s. Link oben).
Abgesehen davon, werden Routine-Aufgaben vereinfacht, hoffentlich für den Laien einfacher, als im Mid-Tier.

Es ist damit ein vollkommen anderer Ansatz, als die Links, die Du freundlicherweise genannt hast.

Kann man das verstehen oder ist die Beschreibung auf der Site irritierend?


Danke, wäre für weiteres Feedback dankbar!


Liebe Grüße
 
Du kannst das natürlich generell so machen. (In die Auflistung in meinem letzten Post hätte ich eigentlich noch „deine Methode“ aufnehmen wollen, habe es aber vergessen.)

Du machst damit die grundlegende Funktionalität deiner Seite eben von JavaScript abhängig. Wer kein JavaScript aktiviert hat, sieht den ungerenderten Quellcode. Ich finde, das ist eine Abhängigkeit, die man nicht unbedingt eingehen muss.

Meinetwegen hat zwar „jeder“ Browser JavaScript aktiviert. Aber grafische Browser sind nicht die einzigen denkbaren Clients, die Seiten abrufen. Die Hürde zur korrekten Verarbeitung ist niedriger, wenn du den HTML-Code bereits serverseitig generierst.

Andererseits gibt es heutzutage natürlich Seiten/Anwendungen, die rein auf Ajax basieren. Der Ansatz ist also durchaus denkbar. Nur löst Ajax ein anderes Problem (asynchrones Nachladen von Informationen ohne Seitenrefresh). Das, was dein Projekt tut, kann dagegen meines Erachtens problemlos serverseitig erledigt werden.

Primäres Ziel meines Tools war aber schon immer, die Redundanz im ge-servten HTML Code zu minimieren...

Das ist mit jedem entsprechenden Ansatz zu erreichen.

(Der Mid-Tier ist sozusagen entlastet)

Jain. Üblicherweise nutzt du dort Caching-Techniken. Einem Cache ist es egal, ob er das fertige HTML-Dokument oder das noch zu kompilierende Dokument mit „JavaScript-Tags“ zurückliefert.

Das fertige HTML-Dokument mag größer sein als die JS-Alternative. Allerdings musst du für JS noch weitere JS-Dateien mitliefern, die zwar meinetwegen clientseitig gecachet werden können, was aber dann bei nachträglichen Änderungen auch nicht ganz unkompliziert ist. Das Laden des initialen Dokuments dürfte zudem länger dauern, weil sämtliche JS-Logik ja zumindest einmal übertragen werden muss.

Die Früchte sind im Bereich SEO zu spüren (s. Link oben).

Das kann ich letztlich nicht beurteilen. Du könntest dir allerdings einen Nachteil für SEO einhandeln, wenn die Suchmaschine kein JS unterstützt, also deinen Inhalt gar nicht kompiliert.

Abgesehen davon, werden Routine-Aufgaben vereinfacht, hoffentlich für den Laien einfacher, als im Mid-Tier.

Möglich, aber im Endeffekt wohl Ansichtssache. Du würdest keinen Webspace benötigen, der serverseitige Programmierung unterstützt, ja. Na ja, ich halte den Ansatz wie oben dargestellt für den schlechteren Weg.

Es ist damit ein vollkommen anderer Ansatz, als die Links, die Du freundlicherweise genannt hast.

Es ist meines Erachtens genau dasselbe; die Ersetzungen finden lediglich nicht auf dem Server statt, sondern beim Client.

Wenn ich mit Source-Dateien deines Systems arbeiten sollte, wäre das Erste, was ich machen würde, deinen JS-Compiler in einer serverseitigen Sprache nachzubauen.
 
Werbung:
Hallo mermshaus,

wow! Das ist soviel, dass ich nur die "Highlights" herausgreifen möchte... :

"Das ist mit jedem entsprechenden Ansatz zu erreichen."
(Gemeint ist, dass der HTML Code *nicht* redundant ist)

Da sind wir unterschiedlicher Meinung.
Meiner Meinung nach ist bei den von Dir gelisteten Ansätzen der HTML Code "redundant".
Die Umwandlung findet im Mid-Tier statt...
Das bereits umgewandelte und damit "redundante" HTML wird geserved.
Bei mir finden die Umwandlung in letzter Millisekunde auf dem Client statt.
Durch die ganze Kette fließen bereits erstmal nur die Abkürzungen.

"Die Früchte sind im Bereich SEO zu spüren"
Du gibst zu, dass das schwer abzuschätzen ist.

Kann nur beteuern, dass das aus dem Client-Projekt:
Oeko-fakt – Klimawandel, Erneuerbare Energien – News zum Umweltschutz – Öko-Fakt
...bereits zu spüren ist.
Die Keyword-Dichte ist etwas höher, wenn weniger Firlefanz in HTML die Suchmaschine ablenkt.
Außerdem kann der PageRank flow durch die "nofollow alternative" positiv beeinflußt werden.
(Schaut Euch gerne mal das HTML der Seite an, und wie schlank es ist...)

"Routine-Aufgaben vereinfachen"
Einigen wir uns darauf, dass es eine zusätzliche Alternative zu bereits bestehenden Mid-Tier Techniken ist.
Natürlich Ansichtssache, ob wirklich einfacher.
Es ist richtig, dass man sich im Extremfall (für besonders einfache Seiten), den Mid-Tier komplett sparen kann...

"Wenn ich mit Source-Dateien deines Systems arbeiten sollte, wäre das Erste, was ich machen würde, deinen JS-Compiler in einer serverseitigen Sprache nachzubauen."

Das check ich leider nicht, klingt aber interessant. Hatte mir überlegt, ob ich gewisse rechenaufwendigere Berechnungen auch auf New HTML tags hosten kann. Also dynamisch von JS aus auf PHP zuzugreifen, statt den Client die ganze Arbeit machen zu lassen. Das wäre allerdings ein "Handshake" mehr, und eine komplexere Architektur...
(Du meinst aber sicherlich was anderes - vielleicht kannst Du's näher erklären...)


Danke und liebe Grüße
 
Hallo mermshaus,

mir ist noch eingefallen - was hältst Du nun von der Google Analytics Substitution?

Man muß bei meiner Lösung nur in http://4nf.org/html.txt
den Code
Google Analytics Code! substituieren...

Dann funktioniert's für jede Page automatisch, die mein Skript einbindet.
Es braucht also kein Gramm HTML auf der Page, um Google Analytics einzubinden...
Der User ist außerdem vor zukünftigen Änderungen seitens Google insuliert
(Die GA-Subsitution verwendet den modernsten GA Stub)


Lg, Arvind.
 
Zurück
Oben