[Wikirobota] Nowy rok czas zacz±æ
Adam Przybyla
adam w ertel.com.pl
Pon, 5 Sty 2009, 14:28:46 CET
On Mon, Jan 05, 2009 at 01:43:31PM +0100, Przykuta wrote:
> pó³ roku temu saper utworzy³ taki zbiór na bazie naszych czerwonych linków:
>
> http://stable.toolserver.org/~saper/wantedpages.txt.gz
>
> Jest tego ponad ponad milion, a ja nie mogê siê do tego dostaæ.
>
> Czy kto¶ móg³by to poci±æ na np. 20 stron po +/- 50 000 wyra¿eñ, a najlepiej 50 stron po 20 000 wyra¿eñ.
>
> Przejrza³bym to z grubsza i wyszuka³ byæ mo¿e jakie¶ powtarzaj±ce siê wyra¿enia. Wtedy mo¿na by takie wybrane zestawy wrzucaæ do wikiprojektów.
>
> Na razie nic nie mogê powiedzieæ, czy co¶ to da, bo nie mogê tego nawet przejrzeæ.
>
> pozdrawiam
>
> przykuta
>
> P.S. Stary opis na TO
>
> http://pl.wikipedia.org/wiki/Wikipedia:Tablica_og%C5%82osze%C5%84/2008-07#16_lipca
... a masz Ci to pod adresem:
ftp://bastylia.ertel.com.pl/wantedpages/
root w bastylia wantedpages]# gzip -dc /root/wantedpages.txt.gz |split -l 50000 - wantedpages.
[root w bastylia wantedpages]# ls
wantedpages.aa wantedpages.ad wantedpages.ag wantedpages.aj wantedpages.am wantedpages.ap wantedpages.as wantedpages.av
wantedpages.ab wantedpages.ae wantedpages.ah wantedpages.ak wantedpages.an wantedpages.aq wantedpages.at wantedpages.aw
wantedpages.ac wantedpages.af wantedpages.ai wantedpages.al wantedpages.ao wantedpages.ar wantedpages.au wantedpages.ax
[root w bastylia wantedpages]#
Powodzenia:) Z powazaniem
Adam Przybyla
Wiêcej informacji o li¶cie Wikirobota