Hemsida som tar ut nyckelord ut text

Permalänk
Medlem

Hemsida som tar ut nyckelord ut text

Tjena,

Tänkte skapa en hemsida där du skriver in en text och sedan tar hemsidan ut alla nyckelord i texten. Jag är en riktig rookie när
det gäller programmering. Tänkte använda servrar från amazons ec2. Nu är frågan vilket språk ska jag lära mig för att kunna
bygga denna site? Går det att koda alla funktionerna med ex mysql i en databas? Vilken AMI(amazon machine image) ska man välja?

Tacksam för hjälp

Permalänk
Hedersmedlem

Kan inget om detta men det låter krångligt, hur definierar du vad som är ett "nyckelord" och inte?

Permalänk
Medlem

@Andreaz1: Tänkte att man skulle kunna ha ett register med bara massa linking words. Sen har du en funktion som tar bort alla ord i texten som finns i det här registret. Slutresultatet blir då en lista med massa nyckelord. Blir väldigt många nyckelord men jag får komma på ngt sätt att lösa det sen..

Permalänk
Hedersmedlem

Jag vet inte hur du tänker dig lösningen, men du klarar dig i alla fall inte med bara mysql.

Ett alternativ skulle kunna vara JavaScript. Det kan du köra dels direkt i browser och dels kan du köra koden på servern med NodeJS.

Andra alternativ som kör på servern är PHP och C#.

Visa signatur

Använd gilla för att markera nyttiga inlägg!

Permalänk
Sötast

Känns som att du börjar i helt fel ände.

Fixa koden först, kör den lokalt på datorn, när allt är packat och klart är det dags att leverera produkten, just nu verkar du mer fokuserad på att leverera något du är osäker på, no offence

Permalänk
Medlem

@Allexz: Vilken kod ska man välja? Går alla koder att föra in i amazons EC2 databaser? Känns som att jag är riktigt borta, haha..

Permalänk
Medlem
Skrivet av sixor99:

@Allexz: Vilken kod ska man välja? Går alla koder att föra in i amazons EC2 databaser? Känns som att jag är riktigt borta, haha..

De flesta språk går att köra på EC2-instanser. Du kan installera nästan vad du vill på dessa, även databaser såsom MySQL osv. Amazon har även egna databaser som gör att du inte behöver sköta allt. Men det känns som du är LÅÅÅÅÅNGT borta från att ens starta upp en virtuell maskin där.
Så börja lokalt med WAMP/LAMP(i en virtuell maskin) eller liknande om du kör MacOS.
Och de ord som saknar relevans heter "stop words" i detta sammanhang.

Grundkoden för allt detta du beskrivit är en halvtimmasjobb för någon som programmerat mer än ett år.

Hur gick det med brödleveranserna fresten?

Hur ett exempel KAN se ut i PHP.

<?php $stopWords = array("than","just","it","is","are","and"); // deklarera stopord. $data = file_get_contents('http://pastebin.com/raw/QrUb3ZBf'); // Hämta data från en sida. $data = preg_replace('/[^A-Za-z0-9\-]/', ' ', $data); // ta bort allt annat än bokstäver och siffror. $data = strtolower($data); // Gör allt till små bokstäver. $words = explode(" ",$data); // Skapa en lista med ord av strängen. $words = array_unique($words); // Ska en lista med endast unika ord. $finalWords = array_diff($words,$stopWords); // Ta bort stoporden ut listan. foreach($finalWords as $word) // Gå igenom slutgiltiga listan och... print $word." "; // Skriv ut orden. ?>

Permalänk

Varför vill du just använda Amazons EC2?

Som skrivits tidigare så kan du välja på att starta GNU/Linux instanser eller MS instanser. På grund av detta kommer alla språk som du kan tänka dig att stödjas.

Var vaksam på kostnaden också, lätt att det drar iväg annars.

Jag provkörde deras 64 CPU cores instans så kraft finns om du behöver det. Möjligt att Amazon har de kraftfullaste instanserna som går att hyra. Ganska så kul att köra benchmarks i deras miljöer