[Wikirobota] Nowy rok czas zacz±æ

Adam Przybyla adam w ertel.com.pl
Pon, 5 Sty 2009, 14:28:46 CET


On Mon, Jan 05, 2009 at 01:43:31PM +0100, Przykuta wrote:
> pó³ roku temu saper utworzy³ taki zbiór na bazie naszych czerwonych linków:
> 
> http://stable.toolserver.org/~saper/wantedpages.txt.gz
> 
> Jest tego ponad ponad milion, a ja nie mogê siê do tego dostaæ.
> 
> Czy kto¶ móg³by to poci±æ na np. 20 stron po +/- 50 000 wyra¿eñ, a najlepiej 50 stron po 20 000 wyra¿eñ.
> 
> Przejrza³bym to z grubsza i wyszuka³ byæ mo¿e jakie¶ powtarzaj±ce siê wyra¿enia. Wtedy mo¿na by takie wybrane zestawy wrzucaæ do wikiprojektów.
> 
> Na razie nic nie mogê powiedzieæ, czy co¶ to da, bo nie mogê tego nawet przejrzeæ.
> 
> pozdrawiam
> 
> przykuta
> 
> P.S. Stary opis na TO
> 
> http://pl.wikipedia.org/wiki/Wikipedia:Tablica_og%C5%82osze%C5%84/2008-07#16_lipca
	... a masz Ci to pod adresem:
ftp://bastylia.ertel.com.pl/wantedpages/


root w bastylia wantedpages]# gzip  -dc /root/wantedpages.txt.gz |split -l 50000 - wantedpages.
[root w bastylia wantedpages]# ls
wantedpages.aa  wantedpages.ad  wantedpages.ag  wantedpages.aj  wantedpages.am  wantedpages.ap  wantedpages.as  wantedpages.av
wantedpages.ab  wantedpages.ae  wantedpages.ah  wantedpages.ak  wantedpages.an  wantedpages.aq  wantedpages.at  wantedpages.aw
wantedpages.ac  wantedpages.af  wantedpages.ai  wantedpages.al  wantedpages.ao  wantedpages.ar  wantedpages.au  wantedpages.ax
[root w bastylia wantedpages]#

Powodzenia:) Z powazaniem
								Adam Przybyla


Wiêcej informacji o li¶cie Wikirobota