Contentsates Logotyp

Jag har de senaste dagarna kört ett intensivt race för att försöka få upp Contentsate – något som har varit lättare sagt än gjort. Nu när jag väl tänker på det känns det lagom naivt att jag trodde att jag skulle klara mig undan några som helst problem med tanke på att Contentsate är den första Ruby on Rails-applikationen jag driftsätter samt att det är första gången jag driftsätter på Amazon EC2.

Hursomhelst, jag har för tillfället en testserver uppe på http://ec2-67-202-10-116.compute-1.amazonaws.com/. Under tiden jag fortsätter att fixa till min produktionsmiljö (behöver fortfarande få upp mina crawlers) hade jag uppskattat om någon kunde testa att söka lite och se om t.ex. lämpliga resultat returneras.

Contentsate är numera lanserad!

Har du några andra förslag eller tips på förbättringar så uppskattar jag om du kan lämna en kommentar nedan! Tack på förhand!

  • Johan Söderberg

    Jag har provat och söka och får upp 2700 träffar på sökningen ”visual thinking”. Bra tycker jag!

  • Hej Johan!

    Tack för att du testade! Du har inga andra synpunkter?

  • Intressanta resultat, väldigt olika Googles. Bra tjänst. Det enda problemet jag ser är att det inte är tydligt vad Contentsate söker för källor. När alla sökresultat kommer från samma sajt (articlealley tex) så inger inte det så stort förtroende. Eftersom många artiklar förekommer på många sajter genom automatisk article distribution så kanske det är bättre att försöka ta artiklar i sökresultatet från dessa olika källor. Dvs om en artikel finns både på articlealley och articlebase så väljer algoritmen den källa som inte redan finns med bland de andra top 10 sökresultaten.

  • Hej Andreas!

    Precis, huvudsaken med Contentsate är att enbart få fram artiklar som man gratis får återpublicera på sin blogg/sajt och således skall sökresultaten skilja sig från Google.

    Ja, ibland blir det rätt många sökresultat från samma sajt, detta beror på att jag enbart crawlat ca 250 000 artiklar hittils, detta kommer dock att förbättras så fort jag får upp mina crawlers med och dessa ligger och snurrar.

    Algoritmidéen är inte dum, jag skall se över vad jag kan göra!

    Tack för feedbacken!

  • Jag antar att en hel del av artikelsajterna har någon sorts ”similar articles” funktion, eller tagfunktion. Det skulle vara intressant om du kan använda denna information för att få fram clusters av artiklar och erbjuda ”drill downs” (jag är sorry för my swenglish). Om jag söker efter ”Google App Engine” så kan jag då få förslag på om jag vill veta mer om google eller cloud computing eller python etc.

    Det kan också vara värt att titta på Yahoo BOSS (http://developer.yahoo.com/search/boss/). De har bla en web service där man kan använda deras spelling service, kanske skulle det vara ett sätt att snabbt få in korrigeringar av stavningen på sökord. Alltså precis som Google har (”do you mean….”).

  • Similar articles låter som en väldigt vettig idé som jag definitivt måste få in på lång sikt. Vad jag sett hittils så har de flesta artikelarkiv inte tags, utan de förlitar sig på kategorier. Genom att läsa in kategorierna med (har förberett för detta, mina crawlers läser dock inte in dem i dagsläget) kanske jag kan lista ut liknande artiklar/fraser för en given sökterm.

    Det finns en spelling service inbyggd i sökmotorn jag använder (http://www.sphinxsearch.com/). Jag kommer att lägga till denna i kommande versioner för att förbättra användarvänligheten.

    Tack för dina synpunkter!

  • Ser rätt bra ut! Svårt att se hur du ska få trafik, dock.

    Och btw, tre stora google-annonser är för mycket =)

  • Hej Anton!

    Trafik har jag tänkt att skaffa mig genom att vända mig till internetmarkandsföringskretsar (t.ex. http://www.thirtydaychallenge.com/, http://www.warriorforum.com/ med flera) då internetmarknadsförare tycks använda sig av en del material från artikelarkiv till sina nichesajter/projekt.

    Okej, jag skall se över annonserna – är fortfarande inte helt 100% över hur jag skall placera dem.

    Tack för din feedback!

  • Hej!

    Vilken bra idé! Mycket imponerad att du lyckats så bra som du gjort med sökmotorn. Hoppas verkligen du får spinn på verksamheten.

    En fråga dock, är det tänkt att det skall gå att söka svenska artiklar eller för den delen artiklar på alla andra språk än engelska?

    Sen saknar jag en beskrivning av vad sökmotorn gör. Tror inte det är helt uppenbart när man kommer dit och gör en sökning att resultatet är att få fram artiklar som man gratis får återpublicera på sin blogg/sajt.

    Ps. När du känner dig klar med sökmotorn får du gärna ta kontakt och skicka en presentation om ditt projekt så kan jag nog publicera det på Nystartat.se.

  • Jag är imponerad över hur bra Sphinx fungerar. Hur tycker du att EC2 har fungerat?

  • Hej!

    @Nystartat.se: Kul att du gillar idéen! Som det är tänkt hittils är engelska det enda språket. Om projektet tar fart kan det dock hända att jag på lång sikt lägger till flerspråksstöd. Jag har också tänkt på det där med beskrivning. Tror jag får skapa en wordpress.com-blogg och skriva ett inlägg om vad tjänsten gör, vem den är till för etc. och länka till den från startsidan (detta tills jag hinner slänga upp en riktig egen blogg).

    Jag skall definitivt höra av mig när projektet är lanserat! Tack för visat intresse!

    @Anders: Sphinx har imponerat väldigt mycket på mig med och jag använder långt ifrån all funktionalitet den erbjuder. EC2 är väldigt intressant. Man får tänka på lite saker som man slipper i vanliga fall (t.ex. att all data på servern/instansen försvinner om servern dör, således får man göra databas-backup rätt frekvent). Som tur är hittade jag ett projekt ( http://ec2onrails.rubyforge.org/ ) som inte bara bygger upp en OK konfigurerad server åt en utan även kommer med backupscript.

    Kul att så många kommenterar! Keep the feedback coming :)

  • Jean

    My queries gave pretty impressive results too, and given the time you had to implement your project I must give you some kudos!

    But there is only one element(…quite insignificant at this stage actually): you should consider taking up the upper ad-band and letting the results part fill the whole left side.

    This for one simple reason: if Contentsate is a search oriented website, the user’s attention should be focused first on the results and won’t get the sensation of landing on one of those parked domain names. But this tips becomes more relevant when it start getting more traffic; then you can compare which design is more suitable.

    Overall; it was a nice job! :)

  • Pingback: Tystnaden är solens fel | Lemeno()

  • Tack för all feedback! Contentsate är nu lanserat: http://www.agiley.se/contentsate-lanserad/