RSYNC van Kraken-Post Mailarchief

De gewenste methode voor spiegelen van het kraken-post archief is Rsync.

snelle en vuile instructie (lees ook de man-page van rsync)

Je kan het Mail-archief met Rsync bijhouden. Op dvxs.nl draait een openbaar toegankelijke rsyncd server hiervoor.

Basis:

rsync -a dvxs.nl::Kraken-post/* .

De punt staat voor de huidge directory, wijzig in pad naar de map waarin je je spiegel wilt doen terechtkomen.
Het commando plaats de gehele website 40mb+ in het pad.
De toegangspagina is index.php, dus je server moet ook nog php draaien.
Wellicht wil je enkel een bepaalde map of de huidge maand.

rsync -a dvxs.nl::Kraken-post/2002/Sep/ .

bovenstaande plaatst alle September mappen in de dot-directory. Zonder / achter Sep in de ./Sep directory. Het bestand index.html is de ingangspagina. Dus het voorbeeldcommando levert je altijd een updated index.html op.

Noot: het archief plaatst de mail in maandmappen die engelstalig , drieletterig zijn en met hoofdletter beginnen: Apr, May, Oct, Sep (doe je voorwerk door te bladeren door de website-jaren...)

Attachments zijn ook ingesloten in de rsync server. Dus gebruik een exclude om deze niet te ontvangen (bijv. --exclude att*).
De tar.gz archieven zijn uitgesloten, die hoef je dus niet apart te --excluden.

De rsyncd server is experimenteel dus phoenix@dvxs.nl over je ervaringen en wensen. Voorlopig is anonymous toegang mogelijk. Anonymous betekent alleen dat je geen wachtwoord hoeft te geven, niet dat je anoniem voor mij bent ;-) In dit geval zou een niet-anonymous toegang alleen zinvol zijn om de load via rsync op de dvxs.nl server beter te kunnen afstemmen.

Cronjobs

Als je een cronjob gebruikt heeft een kortere tijd dan 15 minuten geen zin. Aangezien het archief zelf die 15 minuten aanhoudt voor eventuele nieuwe mail toe te voegen. Bovendien ben jij ook liever voor het Internet als jezelf een 30 minuten of uur aanhoudt. Overigens is een rsync client niet lief voor de computer waarop je het draait: elk bestand wat je opvraagt vreet 100 bytes geheugen op die box. De beste toepassing is dan: niet te vaak of slechts de actuele maand opvragen (gemiddeld 120 bestanden)

Lees de man-page en overige documentatie van rsync voor je vragen stelt.

Waarom rsync

Tot nu toe kon je de kraken-post als archief bijhouden door de mail te ontvangen en te bewaren, door delen of de gehele website archief te leechen (bloedzuigen), of via webscripts in te sluiten in je website of de maandarchieven op te halen uit de directories (bv. 2002/tar.gz.archieven/) daarvoor.
Rsync voegt een methode toe waarmee je een actueel html-webarchief op je lokale computer of binnen je eigen website kan bijhouden. Rsync kan jij draaien zonder systeembeheerder te zijn bij je eigen Internet Service Provider. Hoe je dat doet is niet mijn probleem. Maar aarzel niet als je er niet uitkomt om mij met je probleempjes op te zadelen.

Copyrights
Wees nauwkeurig in de copyrights, hoe dan ook.
Onderstaand de nederlandstalige op ingangspagina van het originele archief:

email op deze website gepubliceerd is als elk emailbericht © afzender
herpublicatie is gewenst en toegestaan met behoud van de oorspronkelijke context of doel van de inzender
in alle andere gevallen is citeren alleen toegestaan met een juiste link naar het origineel
Dit voor het geval je er om vraagt. Waar om?

Pas die aan voor jouw situatie, bijvoorbeeld zelfs een verbod als verwijzing niet meer mogelijk is na een tijd (sic, slik, stik). Maar een beperking tot de eerste zin is voldoende: e-mail gepubliceerd is © afzender

Disclaimer
Het kraken-post-archief heeft geen enkele inhoudelijke beperking (lees kraken-post-faq). Mocht je bij voorbaat bang zijn voor juridische kwesties dan is dat jouw probleem. Het kraken-post-webarchief bevat elk bericht ingestuurd en niet-per-systeem-ongeluk-verwijdert bericht, het archief verwijdert geen enkel bericht aangezien deze al publiekelijk verspreid zijn. Je moet dus zelf bepalen of je disclaimers en persoonlijk ingrijpen in je eigen spiegel ethisch vind.

Kraken-post mailarchief