Projekt på gång? webbdokument parser??

Permalänk
Medlem

Projekt på gång? webbdokument parser??

Jag brukar för det mesta syssla med att utveckla programvaror och inte webbsiter men har den senaste tiden fått ta upp webbutveckling för att kunna göra en najs hemsida för mitt största projekt hittils. Vissa av er kanske vet vilken site jag talar om

Ett verktyg som jag dock har saknat är en dokument parser som skulle ha som huvudsyfte att kolla genom texten i dokumentet och plocka fram statistik. Min huvudsakliga tanke är antalet förekomster av ett ord, sorterat efter förekomster. Allt detta för att lättare kunna plocka ut meta keywords Kanske även införa rättstavning någon gång men framför modulera och dokumentera ett system för att enkelt kunna göra utökningar av programvaran.

Så just nu så håller jag på att göra lite research.
Finns det något sådan tjänst/applikation? Är det licensierat under GNU GPL? Det finns ju alltid diverse hack och annat man kan hitta på, killarna i #php på irc.freenode.org föreslog substr_count vilket hade ju blivit en bra funktion ifall man vill göra det hela som en php webtjänst. Webbtjänster i all ära men jag gillar applikationer som jag kan köra på sekunden och som plockar fram resultat på sekunden med.

För att ställa de huvudsakliga frågorna:

* Finns det något sådant program idag?
* Om Ja, länk, tack!
* Om nej, behövs det ett och vilka fler funktioner skulle man kunna ha?
* OM nej, borde jag ha skapat detta som en poll där man hade kunnat rösta om behovet?
* Förslag på namn?

Visa signatur

Dator: AMD 5800X, ASUS RTX3060, 32GB RAM, Windows 10
Server: Intel NUC i5-4250U, 16GB RAM, Debian