Hemsida som tar ut nyckelord ut text

Trädvy Permalänk
Medlem
Registrerad
Nov 2015

Hemsida som tar ut nyckelord ut text

Tjena,

Tänkte skapa en hemsida där du skriver in en text och sedan tar hemsidan ut alla nyckelord i texten. Jag är en riktig rookie när
det gäller programmering. Tänkte använda servrar från amazons ec2. Nu är frågan vilket språk ska jag lära mig för att kunna
bygga denna site? Går det att koda alla funktionerna med ex mysql i en databas? Vilken AMI(amazon machine image) ska man välja?

Tacksam för hjälp

Trädvy Permalänk
Moderator
Registrerad
Maj 2015

Kan inget om detta men det låter krångligt, hur definierar du vad som är ett "nyckelord" och inte?

ASUS Z97-A | Intel Core i7-4790K | Noctua NH-U14S | ASUS GeForce GTX 1070 Dual OC
2x8GB Corsair Vengeance Pro | Samsung 850 EVO 500GB | Cooler Master V750S
Fractal Design Meshify C | Cooler Master MK750 MX Silent Red | ASUS Strix Claw | Samsung S24D590L

Frågor eller funderingar? Skicka ett PM eller kontakta oss.

Trädvy Permalänk
Medlem
Registrerad
Nov 2015

@Andreaz1: Tänkte att man skulle kunna ha ett register med bara massa linking words. Sen har du en funktion som tar bort alla ord i texten som finns i det här registret. Slutresultatet blir då en lista med massa nyckelord. Blir väldigt många nyckelord men jag får komma på ngt sätt att lösa det sen..

Trädvy Permalänk
Moderator
Registrerad
Aug 2007

Jag vet inte hur du tänker dig lösningen, men du klarar dig i alla fall inte med bara mysql.

Ett alternativ skulle kunna vara JavaScript. Det kan du köra dels direkt i browser och dels kan du köra koden på servern med NodeJS.

Andra alternativ som kör på servern är PHP och C#.

Använd gilla för att markera nyttiga inlägg!

Trädvy Permalänk
Medlem
Plats
-
Registrerad
Dec 2004

Känns som att du börjar i helt fel ände.

Fixa koden först, kör den lokalt på datorn, när allt är packat och klart är det dags att leverera produkten, just nu verkar du mer fokuserad på att leverera något du är osäker på, no offence

Det fanns en gång en båt...

Trädvy Permalänk
Medlem
Registrerad
Nov 2015

@Allexz: Vilken kod ska man välja? Går alla koder att föra in i amazons EC2 databaser? Känns som att jag är riktigt borta, haha..

Trädvy Permalänk
Medlem
Plats
Stockholm
Registrerad
Jan 2004
Skrivet av sixor99:

@Allexz: Vilken kod ska man välja? Går alla koder att föra in i amazons EC2 databaser? Känns som att jag är riktigt borta, haha..

De flesta språk går att köra på EC2-instanser. Du kan installera nästan vad du vill på dessa, även databaser såsom MySQL osv. Amazon har även egna databaser som gör att du inte behöver sköta allt. Men det känns som du är LÅÅÅÅÅNGT borta från att ens starta upp en virtuell maskin där.
Så börja lokalt med WAMP/LAMP(i en virtuell maskin) eller liknande om du kör MacOS.
Och de ord som saknar relevans heter "stop words" i detta sammanhang.

Grundkoden för allt detta du beskrivit är en halvtimmasjobb för någon som programmerat mer än ett år.

Hur gick det med brödleveranserna fresten?

Hur ett exempel KAN se ut i PHP.

<?php $stopWords = array("than","just","it","is","are","and"); // deklarera stopord. $data = file_get_contents('http://pastebin.com/raw/QrUb3ZBf'); // Hämta data från en sida. $data = preg_replace('/[^A-Za-z0-9\-]/', ' ', $data); // ta bort allt annat än bokstäver och siffror. $data = strtolower($data); // Gör allt till små bokstäver. $words = explode(" ",$data); // Skapa en lista med ord av strängen. $words = array_unique($words); // Ska en lista med endast unika ord. $finalWords = array_diff($words,$stopWords); // Ta bort stoporden ut listan. foreach($finalWords as $word) // Gå igenom slutgiltiga listan och... print $word." "; // Skriv ut orden. ?>

Trädvy Permalänk
Avstängd
Registrerad
Nov 2016

Varför vill du just använda Amazons EC2?

Som skrivits tidigare så kan du välja på att starta GNU/Linux instanser eller MS instanser. På grund av detta kommer alla språk som du kan tänka dig att stödjas.

Var vaksam på kostnaden också, lätt att det drar iväg annars.

Jag provkörde deras 64 CPU cores instans så kraft finns om du behöver det. Möjligt att Amazon har de kraftfullaste instanserna som går att hyra. Ganska så kul att köra benchmarks i deras miljöer