Posts by Malchiner

    Bei den Forenübersichtsseiten ist es ähnlich. Deren Inhalt verschiebt sich bei jedem neuen Thema im Unterforum, dementsprechend sind auf der selben URL zu unterschiedlichen Zeiten unterschiedliche Informationen zu finden. Da wird man keine kompletten Beiträge finden, aber dort findet man Informationen wie Themen, wann der letzte Beitrag im Thema war und von wem und wie viele Beiträge insgesamt im Thema zu dem Zeitpunkt existierten. Man kann dort zu Beiträgen zu denen man keinen Text hat, zumindest die ID, den Autor, und den Zeitstempel auslesen um ein möglichst vollständiges Bild zu rekonstruieren.


    Danke für diesen wertvollen Tipp. Ich weiß noch nicht wie ich es anstelle aber das ist was ich jetzt in Angriff nehme. Habe mittels grep schon einiges herausgefunden... Ist halt viel Handarbeit.

    Aus der Hüfte und natürlich ungetestet:

    PHP: viewforum.php
    <?php
    
    $filename = str_replace("?", "_", $_SERVER[REQUEST_URI]);
    
    header( "Location: $filename" );
    
    ?>


    Moin, es funktioniert!

    Das Problem war von Anfang an das verflixte Fragezeichen im Dateinamen. Ich habe versucht die Dateien umzubenennen, ohne Erfolg. Unter Windows geht es nicht einmal nur eine Datei umzubenennen da ein ? im Dateinamen nicht erlaubt ist. Auch bei Versuchen unter Linux ging zwar die einzelne Datei aber bei Mehrfachbenennung gab es Fehler.


    Nun habe ich mir das Forum noch einmal direkt mit dem Pi runter geladen und, siehe da, die Dateinamen wurden mit ? abgespeichert und nicht verändert. Dann habe ich den Ordner auf meinen Desktop PC kopiert und etwas probiert, wobei mir dann auffiel, das der Browser das ? umschreibt auf %3F, die Seite aber anzeigt. Die Lösung ist diese:


    PHP
    <?php
    
    $filename = str_replace("?", "%3F", $_SERVER[REQUEST_URI]);
    
    header( "Location: $filename" );
    
    ?>


    Da macht das Surfen Spaß. Vielen Dank Euch.


    Nun guck ich mal wie ich die Dateileichen rausgefiltert bekomme und zur Anzeige bringe.

    Was steht in der Adresszeile des Browsers wenn Du das Forum willst und was ist die Fehlermeldung?

    Das Forum war forum/viewforum.php?f=2 wie im Beitrag #1 richtig?


    Danach den Apache auch neu geladen?


    Jo, alles korreckt. Ich springe aber gerade im Dreieck. Gucke gerade in den Forum Ordner hinein und alle Dateien sind jetzt mit _ Unterstrich. Was ist das denn? Frisch runter geladen... Mein Betriebsystem hier ist Peppermint also Debian. Die Dateien sind also schon umbenannt bevor ich sie auf den Raspi lade...


    Code
    papi@pihole:/var/www/html/forum $ find *php"?"*
    find: '*php?*': No such file or directory
    papi@pihole:/var/www/html/forum $ find *php_
    index.php_
    memberlist.php_
    posting.php_
    search.php_
    viewforum.php_
    viewtopic.php_


    Unglaublich das. Ich versuche die Dateien mal umzubenennen.

    Also wenn man möglichst viel von den Themen und Beiträgen rekonstruieren möchte, kommt man IMHO nicht darum herum mehr von Wayback herunter zu laden als nur den letzten Stand.


    Verstehe ich nicht ganz. Das Forum wurde im März rum geschlossen und ich habe bis Juni angegeben runter zu laden. Also drei Monate mehr in der die Seite überhaupt nicht mehr erreichbar war.


    Nachtrag: März 2013

    Falls jetzt das direkte "browsen" bei theoretisch funktionierenden Links wieder nicht funktioniert, dann könnte das ggf. daran liegen, dass PHP hier dazwischen funkt.


    Das direkte Browsen geht nicht und der Versuch php zu deaktivieren zeigt das hier:



    Was will der Pi mir nur damit sagen?


    Nachtrag: mit sudo natürlich das Selbe.


    Nachtrag2: geschafft, so weit:


    Code
    Module php7.4 disabled.
    To activate the new configuration, you need to run:
      systemctl restart apache2


    Direkt browsen geht leider immer noch nicht.

    Malchiner Ich hatte mit 5 Threads heruntergeladen und komme auf 532 Megabyte und 7.908 Dateien direkt im ``forum/``-Unterordner:

    Ok, das kommt hin. Insgesammt werden bei mir 8092 Dateien angezeigt und er ist jetzt bei der Hälfte. Wie lange hat das bei dir gedauert?


    Quote

    Ich vermute mal bei den 20 Threads macht Dir Archive.org einen Strich durch die Rechnung und liefert einiges einfach nicht aus, weil 20 Zugriffe gleichzeitig vielleicht auch ein kleines bisschen unverschämt ist


    Die 20 habe ich direkt aus der Anleitung von W-M-Download. War nicht ich der Unverschämte.


    Quote

    Du muss übrigens nicht immer Bildschirmfotos von Informationen machen die eigentlich Text sind. Ein paar Dateinamen kann man auch einfach als Text hier in den Beitrag einfügen:


    Alles klar, werde ich beherzigen wenn möglich.

    Quote
    Code
    Es gibt 30890 interne Links.
    Für 6258 interne Links existiert eine Datei.


    Das ist nicht viel, war aber zu erwarten. Oft ist es so, daß ein Thema z.B. zehn Seiten an Kommentaren hat aber nur die ersten Paar angezeigt werden. Ich nehme an, das hat mit der Scann-tiefe von WayBack zu tun. Das Ganze ist aber bedienbar.


    Quote

    Was ist denn das eigentliche Ziel von der ganzen Aktion?

    Wie ich schon schrieb war ich Mitglied des Forums und weiß, daß dort sehr gute Leute geschrieben haben, welche übrigens schon damals die Situation beschrieben die wir jetzt haben. Das würde hier zu sehr in's Politische gehen,es weiter zu Erläutern. Wenn es denn mal laufen würde, nehme ich mir die Zeit und werte das Forum nach relevanten Dingen aus. Auf Archive.org ist das ein Krampf, erstens wegen der Ladezeiten und zweiten die Springerei zu anderen Zeitstempeln usw.


    Leider habe ich es damals versäumt das ganze Forum zu sichern, obwohl sich die Schließung mit auftauchen von Profitrollen schon angekündigt hat...

    Also wo kommen bei Dir an dieser Stelle die Unterstriche her? 🤔

    Seltsam, ich habe alles noch einmal runter geladen und festgestellt, daß der Parameter --concurrency 20 dafür sorgt nur einen Bruchteil zu laden, obwohl laut Beschreibung steht, daß der Prozess beschleunigt wird da es 20 Dateien gleichzeitig läd.



    Eigentlich sollten das mehr als 500MB sein.


    Ok, Habe den Download noch mal konventionell angeregt. Dauert etwa eine Stunde, was ich Euch ja nicht antun wollen würde, und dann sehe ich mir das nochmal an.




    Nachtrag: Dauert länger als eine Stunde dieser Download. Ich kann aber jetzt schon sehen, daß die Dateien mit ? gespeichert werden. :wallbash:


    Vielleicht hat Malchiner ja Glück und das kommt bei den konkreten Daten nicht oder nur selten vor, aber merken würde man das auch nicht so einfach, wenn man das nicht mal systematisch auswertet.

    Es stimmt schon, daß sehr viele Seiten fehlen. Beim surfen auf Archive.org, was sehr nervig ist weil es dauert bis überhaupt eine Reaktion kommt, stößt man immer wieder auf die Meldung dass eine Seite nicht vorhanden ist. Also Glück habe ich da nicht gerade zumal ich aktiv in diesem Forum tätig war und ganz gut einschätzen kann was da fehlt. Aber, besser den Spatz in der Hand....

    Kannst Du PHP? Dann kannst Du ja eine Datei namens viewforum.php (ohne dem _ am Ende) in diesem Verzeichnis erstellen und damit per header Location auf die Dateien weiterleiten. Das Ziel kennst Du ja dann durch die übergebenen Werte.

    Nein, leider kann ich kein php oder sonst Programmiersprachen. Denkst Du aber nicht auch, daß es vielleicht einfacher wäre die .php_ in .php? umzubenennen. Ich meine es handelt sich hier um über 8000 Seiten welche sich gegenseitig mit ? aufrufen anstatt dem _

    Das habe ich gerade getestet, eine Forenseite aufgerufen, links so 30 Themen und wenn man mit der Maus drüber fährt sieht man halt überall das ?

    Für meinen zweit Pi4 hab ich natürlich auch ein neues Gehäuse gebraucht. Bei Ebay hab ich dann so ein 20 Euro Alu-Passiv Gehäuse gekauft.


    Was Du da hast ist Aludruckguß. Die muß man immer nacharbeiten. Als erstes mal die Farbe ab von den Kontaktflächen und dann den Rahmen sachte runter gefeilt bis die Kontaktflächen aufliegen. Dann sollte auch dieses Gehäuse machen was es soll.

    Auf meinem 4B 8Gb übertaktet, habe ich einen Alu Kühlkörper geschraubt und einen ansteuerbaren 40mm Lüfter gelegt.:



    Der Lüfter wird eigentlich nie gebraucht da der Raspi sich normal so bei 44-45°C hält. Ein Stresstest 25min mit CPU-burn sieht so aus:



    In der raspi-config kann man eh nichts einstellen unter 60°C, so daß der Lüfter dann losrennt und bei erreichen von 50°C wieder abschaltet. Wenn die Entwickler diesen Temperaturbereich als normal ansehen, muß man sich keine Sorge darüber machen, selbst wenn man das Teil dauerhaft mit 60°C quält.


    Vorhin habe ich meinen Pi mal etwas gefordert indem ich ihn ein Backup machen lassen habe und dieses noch per pishrink verkleinerte. Maximaltemperatur:



    War wieder nichts mit Lüften. :)


    PS. Der Lüfter wird bei Gelegenheit noch mit einem Kabelbinder gesichert und gut ist.