◎正当な理由による書き込みの削除について:      生島英之とみられる方へ:

Internet Archive総合 (web.archive.org) #5 YouTube動画>3本 ->画像>69枚


動画、画像抽出 || この掲示板へ 類似スレ 掲示板一覧 人気スレ 動画人気順

このスレへの固定リンク: http://5chb.net/r/esite/1690495133/
ヒント:5chスレのurlに http://xxxx.5chb.net/xxxx のようにbを入れるだけでここでスレ保存、閲覧できます。

1名無しさん@お腹いっぱい。
2023/07/28(金) 06:58:53.37
なんだかんだでお世話になってるInternet Archiveについて語りましょう
Internet Archive
http://archive.org/

インターネット・アーカイブ - Wikipedia
http://ja.wikipedia.org/wiki/InternetArchive
 ------------------
Twitter
https://twitter.com/internetarchive/

関連スレ
【保存・記録】ウェブアーカイブ総合 Page.01
http://2chb.net/r/internet/1554553882/


前スレッド
Internet Archive総合 (web.archive.org) #4
http://2chb.net/r/esite/1628793497/
https://twitter.com/5chan_nel (5ch newer account)
2名無しさん@お腹いっぱい。
2023/07/28(金) 07:00:04.50
【QA】

Q.Internet Explorerで日本語などの2byte言語のページのWeb Archiveキャッシュを見ようとしても
真っ白なページ&文字化けが起きる&極端に重いなどの症状が出てしまう
A.[表示]もしくは右クリック→[エンコード]→[日本語(自動選択)]やその言語の文字コードに則したものをクリック

Q.Web Archiveでダウンロードしたzipなどが開けない&CRCが違うと表示される
A.よくWeb Archiveは1byte欠けを起こすのでバイナリエディタなどで該当ファイルを開き、
16進数の最後の末尾に「00」を付加すると正常なファイルになることがあります。

Q.寄付したいんだけど?
こちらから金額,一度きりか毎月か,送金方法を選んで寄付してください
https://archive.org/donate

Q.すぐに保存したい場合は?
Save Page NowにURLを入力して「SAVE PAGE」ボタンを押す
https://web.archive.org/save/

Q.アカウント作ったらなんかいいことあるの?
A.ページのスクリーンショットを保存したり、ページの全てのリンク先を保存できる「Save outlinks」という機能が使える

[email protected]にメールでURLを送ったら保存されるの?
A.1週間後に保存完了のメールが届いたり、何も戻ってこない失敗した場合があるので、確実に保存したいなら辞めたほうがいい
3名無しさん@お腹いっぱい。
2023/07/28(金) 07:00:23.53
Q.インスタのURLが保存できないんだけど
A.ログインしないとコンテンツが表示されない仕様になったので保存自体が無理になってます

Q.robots.txtでia_archiverをDisallowしても無視されるの?
A.中古ドメインでサイト見れなくするやつのせいでrobots.txtを見ない仕様になったので無視されることも従うこともある。保存できることもあるので確認してみたほうが早い

Q.鯖落ちしてる?
A.ここで鯖状態を見れる
https://analytics0.archive.org/stats/wb.php
https://archive.org/stats/

Q.Temporarily Offline The Internet Archive's sites are temporarily offline. We apologize for the inconvenience. って何?
A.たまにメンテやってサイト見れなくなることがあるので、待ちましょう。ツイッター(@InternetArchive)でメンテ予告は発表しています

Q.Save Page Nowの制限などの仕様は?
A.ここを参照
https://docs.google.com/document/d/1Nsv52MvSjbLb2PCpHlat0gkzw0EvtSgpKHu4mk0MnrA/edit

Q.Save Page Nowで保存完了しても保存されたページが表示されないんだけど
A.完全にページが見れるようになるのと、/*/のページ一覧やカレンダーに反映されるまで時間かかるので最大数日待ってください
ほとんどは数分後には見えるようになってるはず、もしくはウェブブラウザのキャッシュを削除するといいかも
4名無しさん@お腹いっぱい。
2023/07/28(金) 07:01:15.35
Q.「The capture is estimated to start in XX minutes.」って何?
A.Save Page Nowの保存サーバーの空きがなくて保存処理に時間がかかってる状態、急いでなければあとでやるのも手

Q.The same snapshot had been made XX minutes and XX seconds ago. We only allow new captures of the same URL every XX minutes.
A.同じURLを短期間の間に何度も保存できない仕様になっています、誰かが数分前に保存したか、自分で保存したときに一部の画像がかけて保存されている状態でも表示されることがあります
気になるなら1時間後ぐらいにもう一度保存してください

Q.The server didn't respond in time for https://(保存しようとしたURL)
A.極端にページの返答が遅いサイトを保存しようとするとこの表示が出ます、何度かやれば保存できることもあります

Q.「You have already reached the limit of active sessions」が出た
A.同じIPアドレスからの同時保存制限に引っかかってる状態。2021年5月24日以降はログインしていないユーザーは同時保存は3個まで。1分ほど待てば制限解除される

Q.「This URL has been already captured 10 times today. Please email us at "[email protected]" if you would like to discuss this more.」が出た
A.1日に同じURLは10回まで保存できる制限に達したので、また明日(UTC)
5名無しさん@お腹いっぱい。
2023/07/28(金) 07:01:22.75
Q.「This URL has been excluded from the Wayback Machine. 」って何?
A. robots.txtのブロックや、サイトの運営者や著作権者がドメインやこのディレクトリごと非表示化の申請をした可能性があります、
ただしURLの保存はできますし、将来的にブロックが解除されて見れるようになる可能性もあります

Q.「Cannot get status of spn2-乱数」のエラーは何?
A.Save Page Nowで保存中にサーバーの状態が取得できなかったときのエラーで、/*/で保存されているか確認して、されてなければもう一度保存してください

Q.「404 Not Found」のエラーは何?
A.サイトが存在していてもこのエラーが出ることがあります。その場合は時間あけて一度保存してみましょう

Q.「Sorry Job failed」が出た
A.このエラーが出たとしても一部画像やスクリプトファイルが欠けた状態でページ保存できていることがありますので、/*/で確認してみてください
保存できてない場合はやり直してください
6名無しさん@お腹いっぱい。
2023/07/28(金) 07:01:40.39
便利なツール
https://github.com/webrecorder/webrecorder-player/
https://github.com/internetarchive/wayback/tree/master/wayback-cdx-server#query-result-limits
https://github.com/hartator/wayback-machine-downloader
https://github.com/overcast07/wayback-machine-spn-scripts
https://github.com/akamhy/waybackpy
https://github.com/JustAnotherArchivist/snscrape
https://github.com/bibanon/tubeup
7名無しさん@お腹いっぱい。
2023/07/28(金) 07:01:55.63
拒否URL関係まとめ

This URL has been excluded from the Wayback Machine.
https://note.com/
https://gigazine.net/
https://boards.4channel.org/
https://bokete.jp/
https://yoshidakenkou.net/
https://tanteifile.com/
https://motherless.com/
https://www.lancers.jp/

This URL is in our block list
https://finance.yahoo.co.jp/brokers-hikaku/ 以下全て
https://movie.eroterest.net/
https://anime.eroterest.net/

サイトの仕様で取れないもの
https://ch.dlsite.com/matome 記事本文が取得不可、todayなら取れる
https://www.pixiv.net/ 投コメのみ取得可、todayなら取れる

ArchiveTeamのexcludedまとめ
https://wiki.archiveteam.org/index.php/List_of_websites_excluded_from_the_Wayback_Machine
8名無しさん@お腹いっぱい。
2023/07/28(金) 07:02:57.18
アーカイブ済のURL一覧を出力する方法
1. http://web.archive.org/cdx/search/cdx?url=example.com*&;output=txt にアクセス
2. example.comのところをアーカイブしたページのトップページURLに変える。*を誤って消さないようにすること
3. 大量のテキストが出るので全選択してコピー
4. Excel立ち上げてCtrl+Aで全選択して貼り付け
5. 「テキストから列へ」を選んでスペースを基準にセルを区切る
6. セル列のアルファベット文字をクリックしたらその列が全選択になるからURLの列をコピーしてテキストエディタに貼り付けるなりする

同じURLでも保存した時間分の数書いてあるから置換ツールで重複した行を消すこと
IAのURLsでは10000個までしか表示できないがこの方法使ってアーカイブされたURLの正確な総数がわかるはず
WEB版のExcelだと貼り付け時に容量オーバーで受け付けてくれないことがあるからその場合はLibreOffice Calcでも使えばいい
LibreOfficeの場合貼り付け後、表全体の全選択を解除し、1回セルAをクリックしてセルAを全選択した後、データ→テキストから列へ を選ぶことでセル分け可能


引用元: https://exposureninja.com/blog/extract-urls-archive-org/
http://2chb.net/r/esite/1628793497/332
9名無しさん@お腹いっぱい。
2023/07/28(金) 07:25:43.19
>>1おつ

Internet Archive総合 (web.archive.org) #2
http://2chb.net/r/esite/1475246713/5

5 名前:名無しさん@お腹いっぱい。[sage] 投稿日:2016/10/01(土) 04:24:53.46
テンプレのQ&A二件、まだそんなやり方が通用すると思ってる奴いるの?
10名無しさん@お腹いっぱい。
2023/07/28(金) 16:21:28.75
おつでありんす
11名無しさん@お腹いっぱい。
2023/07/28(金) 19:06:10.70
todayだとヤフーニュースが保存できなくなってる
だからInternet Archiveで保存することが増えた

慶応vs横浜だけじゃない…甲子園目指す球児とファンを悩ます高校野球「パイア問題」とは?
news.yahoo.co.jp/profile/comments/55eb7cbd-6f69-41ed-ab91-6d7a3ebd5d16
12名無しさん@お腹いっぱい。
2023/07/28(金) 19:09:18.35
私も19年前鹿児島県大会の夏、三塁塁審の誤審により三点本塁打となり高校野球を終えました。
主将を務めていた私は何度も三塁塁審へ抗議にいきましたが、塁審は「私が間違う訳がない」の一点張り。
その日に放送されたニュースでもしっかりファウルである映像が映し出されましたが判定が覆ったわけでもなく、
むしろその誤審をした審判は今や鹿児島県高野連の審判長まで登り詰めております。
ただ試合後主審の方が私を呼び出し、「審判も人間だから間違うときもあるからね」と声を掛けられました。
誰が見てもわかる誤審であっても審判長にまで登りつめるためには誤審を認めるわけにはいかない、
審判の方々も会社と一緒でそういったなかでされていて大変なのかもしれないとこの歳になって少しわかってきました。

todayでも↑のコメントを保存したかったなあ…
13名無しさん@お腹いっぱい。
2023/07/29(土) 03:23:34.53
盲人でも野球の審判を業務として行えるという実例ですね
14名無しさん@お腹いっぱい。
2023/07/29(土) 14:34:01.29
twitterのプロフィールはwaybackmachineで保存できなくなった
個別のツイートは保存できるけど、コメント欄は保存できないし、いろいろ改悪されたなあ
15名無しさん@お腹いっぱい。
2023/07/31(月) 10:26:16.62
tubeupでひたすらサムネイルだけ上げてる奴って何が目的なんだ?
他の人がアップロード出来なくなるから普通に迷惑なんだが
16名無しさん@お腹いっぱい。
2023/08/01(火) 12:14:52.09
ニコニコとかYouTubeってarchiveで保存しても動画再生出来ないの?
17名無しさん@お腹いっぱい。
2023/08/01(火) 14:26:51.27
>>16
自分は魚拓サイト初心者だから専門的な知識とかは余り持ってないけど
IAやtodayでは動画サイトの動画は恐らく保存されないと思う
18名無しさん@お腹いっぱい。
NGNG?2BP(1000)

>>16 >>17
IAはYouTubeだけ特別に動画も保存される仕様になってる
19名無しさん@お腹いっぱい。
2023/08/02(水) 11:49:36.01
>>14
今はプロフィールも保存できるね(ログインしなくても閲覧出来る)

方針コロコロ変えすぎでわけが分からないよイーロン
20名無しさん@お腹いっぱい。
2023/08/02(水) 14:26:37.14
動画サイトが動画直リン保存すればいける場合もあんのか
21名無しさん@お腹いっぱい。
2023/08/04(金) 14:12:38.34
またTwitterのプロフィール取れなくなってるわ
あのさぁ・・・
22名無しさん@お腹いっぱい。
2023/08/05(土) 21:26:33.08
あれ?また取れるようになってるな
非ログイン状態でも見れるプロフィールと見れないやつがある?
条件が分からん
23名無しさん@お腹いっぱい。
2023/08/06(日) 01:13:10.24
なんかtwitterのプロフィール保存すると、過去ツイがランダムに表示されるだけで、最新のツイートが保存されてない。

もう訳わからんわw
24名無しさん@お腹いっぱい。
2023/08/07(月) 10:27:43.52
archive.orgって画像複数を一括保存とか出来る?
いちいち一つずつURL入力保存しないといけないの?
25名無しさん@お腹いっぱい。
2023/08/07(月) 10:37:01.96
>>24
API が公開されているから、画像に限らずそれ利用するスクリプトを組めばよい。
https://docs.google.com/document/d/1Nsv52MvSjbLb2PCpHlat0gkzw0EvtSgpKHu4mk0MnrA/edit
26名無しさん@お腹いっぱい。
2023/08/08(火) 07:22:55.57
>>24
Have you ever wanted to archive all the web pages linked from an email message?

Well, you are in luck because now you can forward that email to [email protected]
and after a few minutes you will get an email back filled with Wayback Machine playback URLs.
27名無しさん@お腹いっぱい。
2023/08/08(火) 12:31:37.42
>>7
>
> サイトの仕様で取れないもの
> https://ch.dlsite.com/matome 記事本文が取得不可、todayなら取れる
> https://www.pixiv.net/ 投コメのみ取得可、todayなら取れる
>





↑今春までならtodayで取った完全アーカイブをarchive.orgへ再取り出来たんだが拒否URLにされたのか弾かれるようになってしまった。。
 
 
28名無しさん@お腹いっぱい。
2023/08/08(火) 12:46:26.56
前スレ埋まってないんだから前スレに書きなよ
29名無しさん@お腹いっぱい。
2023/08/10(木) 00:08:00.56
dclogもサービス終了
30名無しさん@お腹いっぱい。
2023/08/10(木) 06:52:14.96
>>29
終了告知から終了まで1か月もないとはひどいサービスだな
31名無しさん@お腹いっぱい。
2023/08/13(日) 02:05:43.24
音楽レーベル、デジタル化されたレコードコレクションをめぐりインターネット・アーカイブを提訴
https://www.reuters.com/legal/music-labels-sue-internet-archive-over-digitized-record-collection-2023-08-12/
32名無しさん@お腹いっぱい。
2023/08/13(日) 18:25:16.62
Sheetsのbatch処理ここ数日ずっとqueuedのままや
そんなに使ってる人おるんか
33名無しさん@お腹いっぱい。
2023/08/14(月) 01:51:11.53
archiveってpornhubとかエロ動画直リン保存ってしていいの?
34名無しさん@お腹いっぱい。
2023/08/14(月) 05:36:17.08
>>33
やめとけやめとけ、お前のお母さん悲しむぞ

こんなのも絶対に見ちゃいかんw
https://archive.org/details/adultcdroms
35名無しさん@お腹いっぱい。
2023/08/14(月) 13:55:59.20
>>31
日本語記事も出た

ソニーら音楽各社、著作権侵害でInternet Archiveを提訴。SPレコード2749作品以上をデジタル化・公開
https://www.techno-edge.net/article/2023/08/13/1742.html
36名無しさん@お腹いっぱい。
2023/08/14(月) 19:47:23.54
>>33
internet archiveの規約を見た感じ特にルールは設けられてなさそうだけど、
archive teamによるとコンテンツが削除されたり、アカウントが凍結されたりする可能性はあるらしい

余談だけど、archive teamは元々ポルノはネット上で最も分散保存されているコンテンツだからアーカイブしないという方針だったんだけど
wikiの編集履歴確認したら、今年8月からは通常のコンテンツと同様の扱いにするという方針に切り替えたっぽいな
https://wiki.archiveteam.org/index.php/Porn
37名無しさん@お腹いっぱい。
2023/08/16(水) 07:35:06.43
最近フラッシュのページのアーカイブ見るとruffleっていうSWFエミュレータが起動してフラッシュを再生してくれるようになったな
38名無しさん@お腹いっぱい。
2023/08/17(木) 09:37:24.83
xtubeの動画のアーカイブもなんとかなりませんか
どうせどっかにあるんだろ
39名無しさん@お腹いっぱい。
2023/08/21(月) 07:41:35.73
SPN2のAPIのドキュメントに、「anonymous user」って表記があるんだけど、anonymous でAPI叩くには何を指定すれば良いの?
authorizationヘッダを付けずにAPI呼ぶと、
"You need to be logged in to use Save Page Now."
ってエラーになっちゃう。
anonymousの制約で十分だから、APIキー無しで使いたいんだけどな
40名無しさん@お腹いっぱい。
2023/08/21(月) 17:51:35.50
>>39
それ、応答を HTML でも返せるところを
Accept ヘッダでわざわざ JSON 形式を要求すること自体が要アカウントっぽいんだよね。
どーしてまたそんな所に匿名ユーザ制限が入ってるのかは解らんけど。
41名無しさん@お腹いっぱい。
2023/08/21(月) 22:43:21.39
現状のSPN2APIはよく分からん仕様が多くて「痒い所に手が届かない」感じなので
あまり深く考えない方がいい
42名無しさん@お腹いっぱい。
2023/08/22(火) 22:54:25.65
ヤフー知恵袋、SPNだと取れるのにoutlinksの方だけエラーになってるぽいな
43名無しさん@お腹いっぱい。
2023/08/23(水) 22:13:20.02
ここ最近自動でアーカイブされてないこと多いよな。
御叱りでも受けたか?
44名無しさん@お腹いっぱい。
2023/08/23(水) 22:15:20.98
>>14 イーロンの仕業か。
45名無しさん@お腹いっぱい。
2023/08/24(木) 09:10:55.59
ここ数日やけに接続エラーが起きてると思ったらこれなんだよね。
スクリプトは当面 HTTP へ切り替えるかぁ。
46名無しさん@お腹いっぱい。
2023/08/24(木) 18:22:24.75
>>45
道理で最近つながりづらいことが多いと思ったら・・・
俺環だけではなかったのか
47名無しさん@お腹いっぱい。
2023/08/26(土) 03:04:26.70
久々に SPN2 API のドキュメントを見返していたら、
/save/ に新設のパラメータがあることに気づいたぁ。

use_user_agent=<XXX>
Use custom HTTP User-Agent value when capturing the target page.

2022-07-28 日付けの版で追加されてたのね。
48名無しさん@お腹いっぱい。
2023/08/26(土) 11:12:00.83
Sorry Job failed
と表示されるarchive.orgのページが保存される謎バグに遭遇して笑った
ただの表示バグだと思いたい
49名無しさん@お腹いっぱい。
2023/08/28(月) 17:44:50.52
Atwikiってspn で取れなくなってる?
エラー吐いてる
50名無しさん@お腹いっぱい。
2023/08/28(月) 18:00:19.46
と、何のエラーか説明すらできない言語障碍児が申しております。
51名無しさん@お腹いっぱい。
2023/08/28(月) 18:12:11.36
おま環じゃなかったか
アニオタwiki消えそうだから保存しようとしたんだけどなー
Archiveboxで自分でwarc取るしかないか
センキュー
52名無しさん@お腹いっぱい。
2023/08/28(月) 19:13:33.15
HTTP status=403
atwiki側が意図的に排除してる

エラー吐いてる、だけじゃ何もわからんな
53名無しさん@お腹いっぱい。
2023/08/28(月) 19:38:17.09
atwikiって前は取れた気がするけど
方針変えたのか?
54名無しさん@お腹いっぱい。
2023/08/28(月) 20:32:04.13
https://web.archive.org/web/20230828112759/w.atwiki.jp/aniwotawiki/
403から200に戻ったw
55名無しさん@お腹いっぱい。
2023/08/29(火) 17:46:42.89
Googleだとなぜかhttpの方がインデックスされてるせいで繋がらないな
というかいい加減httpからhttpsに転送するようにして欲しい
56名無しさん@お腹いっぱい。
2023/08/31(木) 09:07:02.89
Internet Archive総合 (web.archive.org) #4
http://2chb.net/r/esite/1628793497/975

975 名前:名無しさん@お腹いっぱい。[] 投稿日:2023/07/24(月) 07:55:27.47
放置してたらURL8万行分集めてて、もう飽きたからこれアーカイブしてdatアーカイブやめます
保存されるやつみたら文字化けしてるし意味あるのかなといった感じでもある
普通の過去ログやる方が有意義におもう

↑エアプ野郎w
57名無しさん@お腹いっぱい。
2023/08/31(木) 11:07:06.36
http://homepage2.nifty.com/J-R/enjoy%20pich.htm
↑のアーカイブを見ようと思ったら「This URL has been excluded from the Wayback Machine.」となってて、つまり除外設定されてるんだけど
これの理由(誰が、いつ申請したか)を知る事って出来る?

禁止しているドメインの一覧は多分↓なんだろうけど、このページ自体は2019年くらいから作られるし、リストに追記される理由とか何も書いてないから詳しくがわからん
https://wiki.archiveteam.org/index.php/List_of_websites_excluded_from_the_Wayback_Machine


個人が作るHPスペースをまるごと除外設定するのが通るのは、インターネットアーカイブの目的としてもちょっと勘弁して欲しいなあ
個人HPこそ後世に残したい
58名無しさん@お腹いっぱい。
2023/08/31(木) 22:19:54.68
>>56
> 保存されるやつみたら文字化けしてるし

テキストエンコーディング変換前のファイル見れるだろ
59名無しさん@お腹いっぱい。
2023/09/01(金) 02:04:41.12
>>58

多分このことじゃね?

https://web.archive.org/web/20230711093514/https://2chb.net/r/dat/1608930977.dat
60名無しさん@お腹いっぱい。
2023/09/01(金) 06:24:58.23
スクリプト回してるのにim_とかid_とか知らないって嘘くせぇ
https://web.archive.org/web/20230711093514im_/https://2chb.net/r/dat/1608930977.dat
61名無しさん@お腹いっぱい。
2023/09/01(金) 13:11:43.12
>>57
理由は公開されないけど基本的にサイトの管理者が除外申請した場合だね
確かにアーカイブの目的には反してるが、ここをしっかりしないと著作権侵害で突かれる可能性があるので
あとexcludedであってdeletedではないのでIAには残ってるはず、オンラインでアクセス不可になるだけ
62名無しさん@お腹いっぱい。
2023/09/02(土) 07:00:06.31
YouTUbeの再生ページがアーカイブされるの遅過ぎだろ。
何やってんだよインターネットアーカイブに保存する人は!全然チェックされてないじゃん!
やる気あんのか?寝てたのか?
どうして誰も保存しないんだ?自動アーカイブはどうした?

ダウンロード&関連動画>>



ダウンロード&関連動画>>

63名無しさん@お腹いっぱい。
2023/09/02(土) 07:42:50.72
YouTubeの再生ページがアーカイブされるのがかなり遅いケースがもう10か月以上も続いている。
公開から10時間後とか。
自動アーカイブはどうしたのか?
64名無しさん@お腹いっぱい。
2023/09/02(土) 13:11:42.88
5chをアーカイブしてもエラーページになる事が増えたなぁ
重くなってるのか?
65名無しさん@お腹いっぱい。
2023/09/03(日) 18:03:57.56
一番上に書いてあるvideoとかmusicってなんですか?
いろいろありますけど保存してもいいんですかね?
66名無しさん@お腹いっぱい。
2023/09/03(日) 19:52:30.07
昔と違い私的理由で使う人が多すぎて
ゴミ集積場化が止まらない
67名無しさん@お腹いっぱい。
2023/09/03(日) 22:28:57.02
archive.today繋がらない
おま環?
>>66
たとえばどんなサイトの事言ってるの?
68名無しさん@お腹いっぱい。
2023/09/04(月) 17:39:35.18
>>64
同感

たとえば「【文春砲】令和の米騒動、現場写真がリークされる」というスレッドも
8月31日の11:32:22は保存できているのに、それ以降はエラーが起きて保存されていない

web.archive.org/web/20230000000000*/http://2chb.net/r/livegalileo/1693474206
69名無しさん@お腹いっぱい。
2023/09/05(火) 10:44:06.47
同じスレを何度も保存する意味あるの?
70名無しさん@お腹いっぱい。
2023/09/05(火) 17:30:52.63
1000までいってないなら意味あるんじゃない
71名無しさん@お腹いっぱい。
2023/09/05(火) 20:42:01.45
もう「なんでも実況(ガリレオ)」板のスレは過去ログの魚拓とれないのかもな

【悲報】安倍晋三語録、「同意」を表すものが存在しない
2chb.net/r/livegalileo/1693837620

IAではserver errorとなるしアーカイブトゥデイでも「Not Found (yet?)」となる → archive.is/I6WEN
72名無しさん@お腹いっぱい。
2023/09/05(火) 23:40:36.69
昔の魚拓見ようにも重いのかエラー出るな
73名無しさん@お腹いっぱい。
2023/09/06(水) 00:36:21.59
>>71
nova.5ch.net は 7 月から継続的に DDoS 攻撃を受けているサーバのうちの一つ。
その対応で、おそらく日本以外の IP 向けに L4 レベルのアクセス制限を掛けている。

http://2chb.net/r/operate/1673084281/16-
74名無しさん@お腹いっぱい。
2023/09/06(水) 15:40:13.70
>>73
なるほど
確かにエラーが起こるのはnovaが多かったな
永久に解除されない、なんてことにならなきゃいいが・・・
75名無しさん@お腹いっぱい。
2023/09/07(木) 17:59:45.87
【悲報】17歳の上玉白人美少女ちゃん、交通事故の罪で終身刑を言い渡される
2chb.net/r/livegalileo/1693978274

このスレもサーバーエラーで魚拓とれなかったからグーグルのキャッシュ経由で魚拓とった
archive.li/pGUd4
76名無しさん@お腹いっぱい。
2023/09/09(土) 08:46:02.23
家のWi-FiでCONNECTION REFUSEDしか出ないから試しに携帯回線につなぎ替えたら普通に繋がった。
手動で取ってただけでアク禁にされたのか
77名無しさん@お腹いっぱい。
2023/09/09(土) 09:07:31.51
>>76
それ、一週間前にうちもやられた。
仕方なく筑波 VPN 挿して、同じようにガンガン回したけどそっちは止められることが無かった。
何が引っ掛かったのか、全くもって判らん。
78名無しさん@お腹いっぱい。
2023/09/09(土) 22:32:08.21
>>76だけど半日くらいで解除されたっぽい
79名無しさん@お腹いっぱい。
2023/09/10(日) 12:26:18.58
>>73-74
eggもエラー起きるな
80名無しさん@お腹いっぱい。
2023/09/12(火) 01:16:30.06
Twitterまた取れなくなってね?
81名無しさん@お腹いっぱい。
2023/09/13(水) 01:14:09.55
前スレのころ20分ぐらいつながらないことがあったが、
それ以上に長くつながらない・・・
82名無しさん@お腹いっぱい。
2023/09/13(水) 07:16:08.88
81の件、ようやくつながった
83名無しさん@お腹いっぱい。
2023/09/14(木) 16:24:12.75
twitter、じゃなくてX取れなくなってるな
個別のポストはtodayの方で辛うじて取れるが
84名無しさん@お腹いっぱい。
2023/09/15(金) 05:44:55.86
twitterで良くね
Xとか勝手に名称変えたアホ以外誰も言ってねえわ
85名無しさん@お腹いっぱい。
2023/09/15(金) 11:00:18.27
ジャスコ、ダイエー、サティ、ダイヤモンドシティ、イオン、
86archive.is/tTrQN
2023/09/15(金) 20:45:51.70
前スレ955への返信だがグーグルキャッシュなどを経由すれば
好き嫌いドットコムのコメント欄も魚拓とれる場合がある

webcache.googleusercontent.com/search?q=cache:syMmr8fOqbkJ:https://suki-kira.com/people
/result/%25E3%2582%2586%25E3%2581%259F%25E3%2581%25BC%25E3%2582%2593
87名無しさん@お腹いっぱい。
2023/09/18(月) 12:38:04.07
>>76
アク禁にされたっぽい
保存はやってなかった、心当たりがあるのは多数の保存済みアーカイブを一斉に開いただけ
88名無しさん@お腹いっぱい。
2023/09/19(火) 01:23:34.92
ツイートと付随する動画像をCSVでまとめて落とせる国産ツールない?
イーロンになってからアーカイブサイトにいれるだけじゃ不安だから、自前で持っておいて必要に応じてアップできるようにしたい
89名無しさん@お腹いっぱい。
2023/09/20(水) 16:11:43.42
Batch process Google Sheetsがabort出来ないバグ何とかしてくれ
相手側に負荷がかかってたらどうすんだよ
9089
2023/09/20(水) 16:18:49.76
やっと止まったわ、遅すぎ
91名無しさん@お腹いっぱい。
2023/09/21(木) 10:05:32.27
5ちゃんも有料化云々でヤバそうだし
スレアーカイブしといた方が良さそうだな…
そろそろ消えそうな予感
92名無しさん@お腹いっぱい。
2023/09/21(木) 13:38:51.45
いつ復旧するかなー
93名無しさん@お腹いっぱい。
2023/09/23(土) 18:28:51.16
Attempts to archive this video failed.
はなんなんだよ
94名無しさん@お腹いっぱい。
2023/09/24(日) 13:01:59.07
savepagenowを実行したあとにgoogleのサポートページ?に飛ばされるのはどういう仕様?
95名無しさん@お腹いっぱい。
2023/09/24(日) 14:22:50.44
twitterの記録取れなくなるのは将来に禍根を残すと思うわ。
数百年後に歴史を振り返った時にSNSは史料的な価値があると思う。
96名無しさん@お腹いっぱい。
2023/09/24(日) 18:43:53.30
今のツイッターって?failedScript=vendorつけても無理になったの?
97名無しさん@お腹いっぱい。
2023/09/25(月) 18:24:55.68
フウーεε=( ~ε~ )y-゚゚゚
98名無しさん@お腹いっぱい。
2023/09/29(金) 16:40:42.99
teacup. byGMOレンタル掲示板あんま残ってねえな
99名無しさん@お腹いっぱい。
2023/10/03(火) 16:40:59.85
もう5chの過去ログ課金しないと見れないっぽいね
100名無しさん@お腹いっぱい。
2023/10/04(水) 10:45:27.46
>>99
現役鯖の分はまだ落ちてくるけどなぁ
http://2chb.net/r/1628/1628793497.dat
/oyster/ 以下のディレクトリインデックスが掘れなくなってはいるが
101名無しさん@お腹いっぱい。
2023/10/04(水) 14:13:19.96
Sorry
Cannot resolve host ipv6.icanhazip.com.

IPv6 の名前解決ができなくなってる
102名無しさん@お腹いっぱい。
2023/10/05(木) 21:27:26.21
todayがちと重い
103名無しさん@お腹いっぱい。
2023/10/07(土) 15:40:46.22
>>99
単純に重いだけじゃない?
104名無しさん@お腹いっぱい。
2023/10/07(土) 18:44:36.46
今繋がらないんだけど、私だけですか?
105104
2023/10/07(土) 18:57:20.21
Wi-Fiに切り替えたら繋がった。
どうやらアク禁らしい。
普通に閲覧してただけだし、何も心当たりないんだけど…
10687
2023/10/07(土) 20:45:50.36
>>105
その「閲覧」もヤバい
107104
2023/10/07(土) 23:17:39.68
>>106
えっ、そうなの?
とりあえず今はアク禁解除されたっぽいけど、
アク禁になる条件って、短時間にたくさん見るとか?
108名無しさん@お腹いっぱい。
2023/10/08(日) 11:31:56.88
人間レベルの閲覧でアク禁になるなんて聞いたことないが
ただの勘違いじゃないの?
109名無しさん@お腹いっぱい。
2023/10/08(日) 11:55:37.48
画像が大量にあるページでそのほとんど取れてなかったりするとすぐ開けなくなる
110名無しさん@お腹いっぱい。
2023/10/08(日) 13:14:20.29
>>109
> 画像が大量にあるページでそのほとんど取れてなかったり

その取れてない画像、全て/save/にリダイレクトされてるから
結果として大量にアーカイブ要求を発行することになるんだよね

んで、その時にアーカイブされるのは3つ程度であとは全て429エラー
運が悪いとそのままアク禁
111名無しさん@お腹いっぱい。
2023/10/10(火) 14:58:47.09
>>99
過去ログについては一応、2chSCへも殆どがミラーされてるはずだけどな…。
112名無しさん@お腹いっぱい。
2023/10/12(木) 23:37:32.61
油断は禁物

あとpink系は全部だめ
5ch新設板系も全部だめ
113名無しさん@お腹いっぱい。
2023/10/12(木) 23:58:45.47
scはクロールされてるなと思って後で確認すると途中でクロールが止まってそのままというのがかなりある
こういう状態になるとクロール再開しないケースが多く5ch側が飛んだ時に頭のほうしか控えが取れてなかったりする
114名無しさん@お腹いっぱい。
2023/10/16(月) 02:19:32.91
過去ログ、今年中は見れない可能性あるらしいな・・・

0119Ace ★
2023/10/13(金) 09:40:26.65ID:CAP_USER
過去ログについてですが、現状はアーカイブ圧縮状態で
展開再配置は相当に時間がかかる見込みです。
完了は年を越す可能性もあります。

http://2chb.net/r/operate/1697113482/119
115名無しさん@お腹いっぱい。
2023/10/18(水) 23:04:25.87
たまに総アーカイブ数が294 billionって表示されるの何なんだ?
116名無しさん@お腹いっぱい。
2023/10/20(金) 22:59:55.77
>>112
一応なんG板とか、2014年春以降に新設された板でもSC側のbbsmenu一覧ページに追加されてないだけで、

[ http://tomcat.2ch.(えすしー)/livegalileo/ ]

…の鯖名から開けばアーカイブされてたりするけど、PINKともども最近の過去ログについては本鯖のモノが未だ活きてる。
117名無しさん@お腹いっぱい。
2023/10/23(月) 17:58:57.35
X保存できるようになってる
118名無しさん@お腹いっぱい。
2023/10/23(月) 17:58:58.33
X保存できるようになってる
119名無しさん@お腹いっぱい。
2023/10/23(月) 17:59:05.79
X保存できるようになってる
120名無しさん@お腹いっぱい。
2023/10/23(月) 18:00:35.82
連投すまん
ミスった
121名無しさん@お腹いっぱい。
2023/10/24(火) 14:07:36.28
>>107-108
残念ながら自分も・・・
前は20分ぐらいつながらなかったのが、
最近は締め付けが厳しくなりそれでは済まないレベルに
122名無しさん@お腹いっぱい。
2023/10/24(火) 14:07:46.22
>>107-108
残念ながら自分も・・・
前は20分ぐらいつながらなかったのが、
最近は締め付けが厳しくなりそれでは済まないレベルに
123名無しさん@お腹いっぱい。
2023/10/25(水) 20:59:15.52
video.twimgとれなくなった?
124名無しさん@お腹いっぱい。
2023/10/27(金) 02:04:52.34
>>123
普通に取れるけど
125名無しさん@お腹いっぱい。
2023/11/02(木) 00:20:55.25
こんなのがいつのまに
2022年11月18日 23時00分レビュー
無料&広告なしで個人サイトを作成できるGeocities風サービス「Neocities」を使ってみたよレビュー
https://gigazine.net/news/20221118-neocities-free-website/
126名無しさん@お腹いっぱい。
2023/11/05(日) 02:15:27.98
利用者の多いコンテンツの生殺与奪を特定小数人が握ってるのは危なっかしいよな
http://2chb.net/r/mnewsplus/1698901347/
まあつべはバックアップを隠し持ってそうだけど こんな金になりそうなもん手放さねえだろうし 一般人が直に利用できないだけで
127名無しさん@お腹いっぱい。
2023/11/05(日) 17:54:34.46
日本の書籍が著作権ありのもたまにいいのがアップされてたのが、騒動以後いっこもアップされなくなったなあ
結構暇つぶしにいいのに
128名無しさん@お腹いっぱい。
2023/11/08(水) 01:45:12.70
質問です
・今開いているサイトの魚拓をワンクリックで取る方法はありますか?
(いちいちInternet Archiveのサイトを開いてコピーしたURLをペーストして決定を押すのがちょっと面倒です

・サイト全体(orサイトの複数ページ)を自動で保存してくれる機能はありますか?
129名無しさん@お腹いっぱい。
2023/11/08(水) 11:53:44.52
>>128
公式のページで使えと書かれている拡張機能
https://chrome.google.com/webstore/detail/wayback-machine/fpnmgdkabkmnadcjpehmlllkndpkmiak
https://chrome.google.com/webstore/detail/archive-page/gcaimhkfmliahedmeklebabdgagipbia
130名無しさん@お腹いっぱい。
2023/11/08(水) 12:48:50.05
アクティブチーム何やってんだよ。
なんで下記のURLは誰もアーカイブしてないんだ?

ダウンロード&関連動画>>

131名無しさん@お腹いっぱい。
2023/11/08(水) 13:50:28.69
アクティブチームw
132名無しさん@お腹いっぱい。
2023/11/09(木) 20:53:09.04
どうしてもすぐにアーカイブしたい動画があるならtubeupを使って自分でうpするか
Yt-dlpを使ってメタデータを含めてローカルに落とすのが理想や!
133名無しさん@お腹いっぱい。
2023/11/10(金) 23:40:24.43
ArchiveTeamは特定の動画(削除の危機がある, ニュース, 政治etc)に限定して保存してるから、保存したい動画は手動保存する必要がある
リソースは有限だからね
↓詳細
https://wiki.archiveteam.org/index.php/YouTube#Scope
134名無しさん@お腹いっぱい。
2023/11/11(土) 13:29:16.82
Wayback Machineに保存されてるそこそこ古めのページを表示すると、一部の画像が表示されない事ってよくあるよね。
あれって何でああなってるの?たとえば以下のページなど。
https://web.archive.org/web/20021017173116/http://www.namco.co.jp/home/cs/lineup/mrdriller/page01.html

このページは2002年保存だけど、比較的新しい2010年とかに保存されたページでも同現象になってたりする。
当時保存した人も、ちゃんと保存できてるか確認して、当時は問題なく表示されてたんだと思う。
今俺たちが保存してるサイトも、10年後には画像がところどころ抜け落ちて不完全な状態になるのかと不安。
135名無しさん@お腹いっぱい。
2023/11/11(土) 13:32:47.70
確認されてないから画像が抜け落ちてる
136名無しさん@お腹いっぱい。
2023/11/11(土) 15:59:18.06
>>134
そもそも Internet Archive でヘッドレスブラウザを実装したのがほんの数年前のことで、
それまでは指示された単一のファイルをアーカイブするだけだったから。

アーカイブされた HTML をクライアント側のブラウザで表示したときに
個々の画像等の保存リクエストが Internet Archive へ発行されるような実装が
なされたこともあったが、それ自体も 2010 年代中盤だったはず。
137名無しさん@お腹いっぱい。
2023/11/11(土) 19:27:03.13
そうかなぁ?
俺はInternet Archive側にある画像ファイルが何らかの理由で勝手に消滅したと思ってる。
以下のサイトとかもそう。画像が1つも保存されてないのはおかしいだろ。
https://web.archive.org/web/20131007222449/http://www.spike-chunsoft.co.jp/fr/index.html
138名無しさん@お腹いっぱい。
2023/11/11(土) 19:39:27.54
>>137
それ Alexa のクローラが保存したアーカイブだしw
139名無しさん@お腹いっぱい。
2023/11/11(土) 20:41:42.88
>>137
https://ja.wikipedia.org/wiki/%E3%82%A4%E3%83%B3%E3%82%BF%E3%83%BC%E3%83%8D%E3%83%83%E3%83%88%E3%82%A2%E3%83%BC%E3%82%AB%E3%82%A4%E3%83%96
IA自身がクローラーを回して収集活動を始めるまでの歴史について知っておくと良い。
140名無しさん@お腹いっぱい。
2023/11/11(土) 21:56:56.93
昔のエッチサイトで自分が見たいところだけ抜け落ちてる悲しみ(´・ω・`)
141名無しさん@お腹いっぱい。
2023/11/13(月) 01:18:15.56
IAのアーカイブって色んな団体のアーカイブがまとまったものだからな、SPNなんてごく一部だよ
画像も収集してる団体もあれば、HTMLだけを取得してる団体もあるのでアーカイブ次第
例えばウェイバックマシンを使ってるとよく目にするCommon Crawlはほぼ画像が取得されてない
142名無しさん@お腹いっぱい。
2023/11/13(月) 11:01:00.35
確実に保存したい時は
InternetArchiveとArchive.todayどっちもアーカイブしてるわ
それで大体残ると思うけどどうだろ
143名無しさん@お腹いっぱい。
2023/11/13(月) 21:58:51.62
>>141
それで精度だったり保存量にばらつきがあるんすね
144名無しさん@お腹いっぱい。
2023/11/14(火) 22:23:03.18
ここ最近自動アーカイブがされてないようだけど一体どうしたんだ?
145名無しさん@お腹いっぱい。
2023/11/15(水) 13:06:21.31
ここのアーカイブ開いても年齢確認から先に進めない

ラズパイでエロゲ
https://sirius10.net/Games/hgames.php
146名無しさん@お腹いっぱい。
2023/11/15(水) 13:33:45.41
>>145
クッキー喰ったことにすればアーカイブはできるな。
使うのは API の capture_cookie パラメータ。
https://web.archive.org/web/20231115043115/sirius10.net/Games/hgames.php
147名無しさん@お腹いっぱい。
2023/11/15(水) 16:29:16.84
えっ?年齢認証のページも保存できたの?初めて知った。
以前、以下のページを保存したかったけど諦めたんだ。
https://www.konami.com/games/pcemini/jp/ja/
もしこのページ保存できるなら、上部メニューの8ページほど保存しといてほしい。もしくはそのAPIの使い方を具体的に教えてほしい。
まだ誰も上手く保存できてないみたいだし。
148名無しさん@お腹いっぱい。
2023/11/15(水) 16:34:01.70
保存してほしいのは以下の6個のURL。もし保存できるのであればだけど。
https://www.konami.com/games/pcemini/jp/ja/
https://www.konami.com/games/pcemini/topics/jp/ja/topics_9
https://www.konami.com/games/pcemini/feature/jp/ja/
https://www.konami.com/games/pcemini/faq/jp/ja/
https://www.konami.com/games/pcemini/inquiry/jp/ja/
https://www.konami.com/games/pcemini/product/jp/ja/
149名無しさん@お腹いっぱい。
2023/11/15(水) 16:54:07.39
保存したい気持ち、解るなぁ
https://web.archive.org/web/20231115074138/www.konami.com/games/pcemini/jp/ja/
150名無しさん@お腹いっぱい。
2023/11/15(水) 17:04:47.72
>>149
確認できたわ、ありがとう!
Internet Archiveを極めてるね!
151名無しさん@お腹いっぱい。
2023/11/15(水) 23:20:06.19
>>146
すげえ、ありがとう
152名無しさん@お腹いっぱい。
2023/11/18(土) 14:45:36.85
If something goes wrong please click here to send us an error report.
ってやつ、下じゃなくて上に配置してくれないかな・・・
何回誤送信したか分からん
153名無しさん@お腹いっぱい。
2023/11/18(土) 15:42:54.81
twitter保存できないことが最近増えてるみたいだけど、archivetodayでも保存できない場合は、cacheリンクをぶち込むと保存できるでー
154名無しさん@お腹いっぱい。
2023/11/19(日) 14:41:27.28
twitter以外の保存できないサイトも、

https://webcache.googleusercontent.com/search?q=cache:保存したいリンク

をWabackmachineに入れればキャッシュを保存できる。
155名無しさん@お腹いっぱい。
2023/11/19(日) 14:44:57.55
認証要る系は無理
156名無しさん@お腹いっぱい。
2023/11/19(日) 19:17:19.50
twitterならnitterで良くね?
157名無しさん@お腹いっぱい。
2023/11/19(日) 19:21:06.50
リダイレクトページを保存して過去のアーカイブ上書きして使いづらくする問題
なんで放置されてんだよ!
158名無しさん@お腹いっぱい。
2023/11/20(月) 04:47:38.50
俺も基本nitterキャプってるなTwitter取得する時は
159名無しさん@お腹いっぱい。
2023/11/21(火) 01:55:39.65
"The requested video has been archived but is not currently available for playback."と"Attempts to archive this video failed."が出たときが一番ダルい
160名無しさん@お腹いっぱい。
2023/11/22(水) 20:57:37.32
イーロン・マスクのせいで、1tweetごとにarchiveしないといけなくなったけど、
より問題なのは、tweet群が本人の削除やアカウント停止などで消されてしまったら、
archiveがあってもtweet同士のつながりがわからなくなること。
以前はtweetを1カ所か何カ所かwayback machineで押さえれば、スレッド丸ごとarchiveできたのに。
161名無しさん@お腹いっぱい。
2023/11/23(木) 07:29:06.67
何度保存しても「Hrm. The Wayback Machine has not archived that URL.」が出続ける。
162名無しさん@お腹いっぱい。
2023/11/23(木) 16:23:31.19
>>160
ほんとゴミだよな
戻してくれないもんかね…
163名無しさん@お腹いっぱい。
2023/11/25(土) 06:53:47.53
>>161
https://web.archive.org/save/

このページからやればできる。
164名無しさん@お腹いっぱい。
2023/11/25(土) 07:21:35.68
>>161
> 何度保存しても

数日後、その何度も保存したのが一斉にカレンダーに登場するパターンw
165名無しさん@お腹いっぱい。
2023/11/25(土) 15:36:03.02
SPNって一日1000ページ保存が上限なのか。初めて引っかかった。outlink込みでやってたからか。

あと最近頻繁にログアウトしてしまうんだけどこれも不具合なのかな。
166名無しさん@お腹いっぱい。
2023/11/27(月) 21:08:31.71
>>162
戻る可能性もありそう。

ツイッターの閲覧制限 「経済的な理由という指摘もある」と辛坊治郎
https://news.1242.com/article/448206
Twitter閲覧制限 の理由:データスクレイピング の全てを わかりやすく 説明します
https://sotatek.jp/blogs/all-about-the-reason-behind-twitter-new-view-limit/
「情報はタダじゃない」訴える意図? Twitter閲覧制限 “スクレイピング”…サーバー負荷にマスク氏不満か
https://news.ntv.co.jp/category/society/9517009c0a124432a4ae38cecc2a2cf4
【解説】ツイッター“閲覧制限”なぜ? 考えられる2つの理由 マスク氏の狙いは
https://news.ntv.co.jp/category/society/78ed7d1aae84431889171d51800beb37
Twitterの閲覧制限が起きた理由|今後のビジネスへの影響は?
https://blog.formzu.com/twitter_limit
167名無しさん@お腹いっぱい。
2023/11/28(火) 12:24:55.48
>>165
> SPNって一日1000ページ保存が上限
それ何処から来た数字よ?

https://web.archive.org/save/status/user
168名無しさん@お腹いっぱい。
2023/11/28(火) 21:40:26.81
イーロンの野郎また何かやらかしたのか。
169名無しさん@お腹いっぱい。
2023/11/29(水) 10:54:45.08
どっとうpろだ.orgサービス終了かよ
知らなかった
170名無しさん@お腹いっぱい。
2023/11/30(木) 19:42:48.90
忘れた頃に消えてくれるからお世話になったなぁ・・・
長いことおつかれさんでした
171名無しさん@お腹いっぱい。
2023/12/01(金) 16:35:49.47
saveできない状態
172名無しさん@お腹いっぱい。
2023/12/01(金) 18:34:12.83
普段は「Not Found」が出ても何遍か更新すると正常に戻るが、今は何遍更新しても・・・
173名無しさん@お腹いっぱい。
2023/12/01(金) 19:28:00.38
マジか。保存対象URL側に問題あるのかと諦めて魚拓で済ましたけどIA側の問題だったのか
174名無しさん@お腹いっぱい。
2023/12/01(金) 20:03:23.58
URL側の場合は「Not Found」というか普段から「このURLは保存不可」的なのが出るが、
今はどのサイトを入力しても「Not Found」
175名無しさん@お腹いっぱい。
2023/12/01(金) 21:10:57.63
JSON で user status を得ようとしても 503 が返る
逝っちゃってるねぇ
https://web.archive.org/save/status/user
176名無しさん@お腹いっぱい。
2023/12/01(金) 21:28:40.39
今日朝からnot foundだったから来てみたらおま環じゃなかったか
177名無しさん@お腹いっぱい。
2023/12/01(金) 23:30:32.34
ようやくできるようになったが、4時間待ち(待ち時間は環境によるだろうが)
178名無しさん@お腹いっぱい。
2023/12/01(金) 23:31:28.89
復活したけど、これじゃ今日のページ存できないな
The capture will start in ~7 hours, 39 minutes because our service is currently overloaded. You may close your browser window and the page will still be saved.
179名無しさん@お腹いっぱい。
2023/12/02(土) 15:23:15.03
待ち時間未明よりは減ってるが、まだ1時間待ち(環境によるだろうが)
ただし、PDF絡みの取得は問題なし
180名無しさん@お腹いっぱい。
2023/12/02(土) 15:52:02.12
重い
181名無しさん@お腹いっぱい。
2023/12/03(日) 02:47:23.34
14 hoursとか取得時間かかりすぎ
182名無しさん@お腹いっぱい。
2023/12/03(日) 19:22:18.20
やっと直ったか
183名無しさん@お腹いっぱい。
2023/12/03(日) 19:46:55.79
ページを保存しようとしたら

The capture will start in ~3 hours, 5 minutes because our service is currently overloaded. You may close your browser window and the page will still be saved.

と言われて、まだ終わらないけど、MP4動画単体を保存したら瞬時に保存された。

2023/12/03(日)19:39:14
URL:
Job: https://web.archive.org/save/status/spn2-a3a61ee7a77e38b016777f4e7c9b1139d337b0d8 [success][0.29s][初]
成功: https://web.archive.org/web/20231203103915/https://video.twimg.com/amplify_video/1727180400236417024/vid/avc1/1280x720/WJL1FSGpy8aLWnvc.mp4 - 2023/12/03(日)19:39:15
184名無しさん@お腹いっぱい。
2023/12/04(月) 03:03:18.62
>>183
.jpg とか .png とか .zip とか、ヘッドレスブラウザでレンダせず
ファイル単体を保存するだけで済むものはそんな感じ。
.pdf も outlinks の走査はされるけど何故か速い。
185名無しさん@お腹いっぱい。
2023/12/05(火) 01:10:50.73
でた蔵の過去のテレビ番組のアーカイブ2022年12月以前の削除されちゃったんだな、最悪
gooといい価格コムといい削除するなら最初から公開しなきゃいいのに
NHKも一時期過去の番組表見れないようにしてたし何の目的なんだろうな
維持するのも金がかかるのかねえ
186名無しさん@お腹いっぱい。
2023/12/05(火) 10:15:27.60
更新終了および閉鎖のお知らせ
2017年7月より更新を続けてきたウェブメディア「wezzy」ですが、2023年12月31日をもって更新を終了する運びとなりました。長年のご愛読ありがとうございました。
2024年3月31日にサイトの完全閉鎖を予定しております。

https://wezz-y.com/archives/95862
187名無しさん@お腹いっぱい。
2023/12/05(火) 10:15:30.24
更新終了および閉鎖のお知らせ
2017年7月より更新を続けてきたウェブメディア「wezzy」ですが、2023年12月31日をもって更新を終了する運びとなりました。長年のご愛読ありがとうございました。
2024年3月31日にサイトの完全閉鎖を予定しております。

https://wezz-y.com/archives/95862
188名無しさん@お腹いっぱい。
2023/12/05(火) 20:35:42.29
こんな糞重いクルクルクルクルしてるだけのゴミクズサイト
すでに2億円も寄付されてるの糞受けるな
裏金アベノイミン党みたいな連中だ
189名無しさん@お腹いっぱい。
2023/12/06(水) 10:55:02.43
Not Found
The requested URL was not found on the server. If you entered the URL manually please check your spelling and try again.

saveできない
また逝ってるのかな
190名無しさん@お腹いっぱい。
2023/12/06(水) 12:06:41.28
またエラー吐いてる・・・
191名無しさん@お腹いっぱい。
2023/12/06(水) 17:58:46.73
まーた404 NOT FOUNDだぞー
192名無しさん@お腹いっぱい。
2023/12/06(水) 19:14:32.73
OH!! NO!!
193名無しさん@お腹いっぱい。
2023/12/06(水) 20:29:25.03
やっと復旧した

┃ 午前9:18 ・ 2023年12月6日
https://twitter.com/textfiles/status/1732192819098292677
┃ Jason Scott @textfiles
┃ Power has gone out at the @internetarchive primary datacenter; waiting for it to return.

┃ 午前10:04 ・ 2023年12月6日
https://twitter.com/internetarchive/status/1732204429066289608
┃ Internet Archive @internetarchive
┃ Sorry, http://archive.org and http://openlibrary.org will be back in a few,

┃ but a short term power outage was long enough to make recovery take a little while.

┃ We apologize.
https://twitter.com/thejimwatkins
194名無しさん@お腹いっぱい。
2023/12/07(木) 15:12:31.98
停電多すぎね?アメリカってそんな停電するの?
195名無しさん@お腹いっぱい。
2023/12/11(月) 10:14:59.64
あ゙あ゙あ゙あ゙あ゙ーーー
196名無しさん@お腹いっぱい。
2023/12/11(月) 19:40:20.47
ここ何日か>>195のような表示がそのときそのときで出たり出なかったり
取得そのものができないよりは増しとはいえ・・・
197名無しさん@お腹いっぱい。
2023/12/11(月) 19:45:40.20
>>196
やっぱそうだよね、自分の環境のせいかと思ってたけど
198名無しさん@お腹いっぱい。
2023/12/11(月) 21:54:33.55
Donateしまくらなきゃな
199195
2023/12/11(月) 22:16:37.71
11 時間 42 分経過、結局アーカイブされてなかったからリクエスト発行し直した。
てゆーか 10 時間とか 20 時間とか言われても、数分後に同じ URL のアーカイブを
再リクエストしたらタイミングによってはすぐ保存してくれることもあるので
こういう時はやり直すのが正解だと理解することにした。
200名無しさん@お腹いっぱい。
2023/12/12(火) 01:25:40.30
緑色の一日おき程度に取得した不完全なのを見かけるけどこういう事象の跡なのね
201名無しさん@お腹いっぱい。
2023/12/12(火) 19:24:45.55
Save outlinksで取得出来るページ数減らされてる…
202名無しさん@お腹いっぱい。
2023/12/12(火) 20:23:08.77
何個まで?
203名無しさん@お腹いっぱい。
2023/12/12(火) 20:25:41.13
まあここ最近、調子悪いからな。
しばらくすれば元に戻るかも。
204名無しさん@お腹いっぱい。
2023/12/12(火) 20:51:11.11
近い内にサーバー飛んでサ終かもな
205名無しさん@お腹いっぱい。
2023/12/12(火) 21:35:01.32
Sorry

You cannot make more than 100 captures per day. Please email us at "[email protected]" if you would like to discuss this more.
206名無しさん@お腹いっぱい。
2023/12/12(火) 22:59:52.35
なんかめちゃスムーズにspnリクエスト送れるようになってる
昨日ぐらいまでめっちゃ糞詰まり起こしてたのに
207名無しさん@お腹いっぱい。
2023/12/12(火) 23:51:14.97
>>205
アカウント作れよ、上限が 300 倍に増えるぞ

てゆーか登録ユーザの daily_captures_limit の値、30000 まで減ってるのな
208名無しさん@お腹いっぱい。
2023/12/12(火) 23:55:59.07
Sorry
Job failed
ってIAの画面がアーカイブされてる?ときって失敗ってことなんかな
209名無しさん@お腹いっぱい。
2023/12/13(水) 00:05:36.88
>>208
自分の経験ではアーカイブできてる事も失敗してる事もある
そういう時は web.archive.org/web/2/ に対象の URL を付けて
最新のアーカイブを表示させてみてる
210名無しさん@お腹いっぱい。
2023/12/13(水) 00:13:02.17
せっかく>>206と思ったら今度は・・・
今までの1割とは落差がでかい
211名無しさん@お腹いっぱい。
2023/12/13(水) 03:24:05.46
何回やってもどのサイトでもsorryになって保存できない
212名無しさん@お腹いっぱい。
2023/12/13(水) 04:01:02.50
ろくに英語も読めないのにここでアーカイブ取ろうとしてるからだよ
213名無しさん@お腹いっぱい。
2023/12/13(水) 08:31:24.05

日本語のサイトしか保存した事ないけど…
つか1日100件なんて保存してないのに⇓が出る
前にキャッシュcookie消去したらarchiveでの履歴も消えちゃったから消すの嫌なんだけどなあ

Sorry
You cannot make more than 100 captures per day. Please email us at "[email protected]" if you would like to discuss this more
214名無しさん@お腹いっぱい。
2023/12/13(水) 08:59:55.49
100件も取得してなくても出るとか・・・ますます謎
215名無しさん@お腹いっぱい。
2023/12/13(水) 11:42:51.22
>>214
> 2023/12/13(水) 08:59:55.49

カウンターがリセットされる時刻の 5 秒前w
昨日の分も一緒にカウントされてるんじゃないの
216名無しさん@お腹いっぱい。
2023/12/13(水) 17:44:14.23
画像とか含めてじゃないの
217名無しさん@お腹いっぱい。
2023/12/13(水) 18:18:11.85
>>215
214だが、>>213と同一ではない
こっちは100件超えてたからまだしも、>>213のようなこともあると驚いたまで
218名無しさん@お腹いっぱい。
2023/12/13(水) 19:04:25.63
>>207
同時実行可能なセッション数も微妙に調整してますね

2023/02/18(土) {"available":6,"daily_captures":0,"daily_captures_limit":100000,"processing":0}
2023/08/21(月) {"available":6,"daily_captures":0,"daily_captures_limit":80000,"processing":0}
2023/09/06(水) {"available":6,"daily_captures":0,"daily_captures_limit":70000,"processing":0}
2023/09/29(金) {"available":8,"daily_captures":0,"daily_captures_limit":70000,"processing":0}
2023/11/23(木) {"available":8,"daily_captures":0,"daily_captures_limit":50000,"processing":0}
2023/12/12(火) {"available":7,"daily_captures":0,"daily_captures_limit":30000,"processing":0}
219名無しさん@お腹いっぱい。
2023/12/13(水) 22:13:35.46
一方、アカウントなしの場合は>>4にあるとおり1分あたり3件
昨年の途中まで4件、今年でもわずかに4件だったことも
http://2chb.net/r/esite/1628793497/453
http://2chb.net/r/esite/1628793497/637
http://2chb.net/r/esite/1628793497/729
220名無しさん@お腹いっぱい。
2023/12/14(木) 09:04:07.36
「日付」が切り替わってカウント数が0に戻るのは日本時間朝9時です
221名無しさん@お腹いっぱい。
2023/12/15(金) 17:24:20.13
SPN2APIでリファラーって送る方法ある?
222名無しさん@お腹いっぱい。
2023/12/15(金) 22:35:38.95
無いね
ページ内で使われてる画像なんかには送られてるみたいだけど
223名無しさん@お腹いっぱい。
2023/12/15(金) 22:44:59.91
>>222
無いか〜・・・、サンクス
224名無しさん@お腹いっぱい。
2023/12/16(土) 01:38:13.04
nitter.net保存できなくなってる。
nitter.czならtodayの方で保存できるが
225名無しさん@お腹いっぱい。
2023/12/17(日) 20:30:36.67
Twitterはもう保存できなくなったのか?
保存した後、だいぶ経ってから保存されているはずの日付を見に行ったら中身が何もない。
そういうのばかり。
226名無しさん@お腹いっぱい。
2023/12/18(月) 15:22:07.99
Twitter側の仕様変更のせいで見た目はアーカイブできなくなった
ソースを見るとツイート内容はアーカイブされてるっぽい
227名無しさん@お腹いっぱい。
2023/12/18(月) 15:57:48.09
本家のtwitter.comも、nitter.netもウェイバックマシンでは保存できなくなってる。
今は、nitter.czをarchive.todayの方にぶち込むしか方法がない。
228名無しさん@お腹いっぱい。
2023/12/18(月) 16:54:37.67
今でも更新続ければ保存はできるけど、数日待たないとできなかったりで安定はしない
229名無しさん@お腹いっぱい。
2023/12/21(木) 04:31:49.98
登録しても制限をかけるなら、有料プランを導入してくれ
230名無しさん@お腹いっぱい。
2023/12/21(木) 09:52:22.88
最近すこし保存しようとして更新するとすぐアク禁されて駄目だわ
231名無しさん@お腹いっぱい。
2023/12/22(金) 15:05:19.09
アク禁ってされたことないんだけど、どんな表示でるんだ
232名無しさん@お腹いっぱい。
2023/12/22(金) 15:05:21.69
アク禁ってされたことないんだけど、どんな表示でるんだ
233名無しさん@お腹いっぱい。
2023/12/22(金) 15:06:53.26
すまん連投になってもた
234名無しさん@お腹いっぱい。
2023/12/22(金) 15:15:17.32
>>231-233
相手サーバが無反応になる
何も返らないからブラウザ組み込みのエラーメッセージが出る
235名無しさん@お腹いっぱい。
2023/12/23(土) 17:21:40.52
2〜3秒に1回位のアクセスに抑えておけばまずアク禁はされないと思うが
236名無しさん@お腹いっぱい。
2023/12/24(日) 20:12:20.28
アーカイブチームの皆さんは自分の事しか考えてないの?
あれだけ顧客第一つったろ!
237131
2023/12/24(日) 23:14:02.35
>>236
アーカイブチームって覚えられたんだw
すごいね
238名無しさん@お腹いっぱい。
2023/12/25(月) 14:38:28.21
次はアーカイブチームとインターネットアーカイブは無関係って事を覚えような
239名無しさん@お腹いっぱい。
2023/12/26(火) 07:40:40.52
自動保存できなくなったの?
240名無しさん@お腹いっぱい。
2023/12/28(木) 19:50:12.24
https://archive.is/rt7gI
Archive.org is DOWN for everyone.
241名無しさん@お腹いっぱい。
2023/12/29(金) 15:27:27.42
SPNとSPN-outlinksで結果が変わるの謎過ぎるな
SPNだと取れるのにoutlinksの方はエラーが出るサイトがたまにある
わざわざ別の環境使ってるのか?
242名無しさん@お腹いっぱい。
2023/12/29(金) 16:01:08.08
と書いておいて何のエラーか一切説明しない低能
243名無しさん@お腹いっぱい。
2024/01/03(水) 15:31:04.59
>>220

φ(`д´)メモメモ...
244名無しさん@お腹いっぱい。
2024/01/05(金) 00:43:45.29
archive.todayのほう死んでます?
245名無しさん@お腹いっぱい。
2024/01/05(金) 02:20:34.95
一時間くらい前、ぐるぐるアイコンを表示したままリロードを繰り返す状態だったな。
246名無しさん@お腹いっぱい。
2024/01/05(金) 21:00:47.72
アーカイブ開こうとすると実アドレスの方に飛ばされる症状が出てる
アーカイブに保存された形跡はある ただこれも保存済みアドレスが検索で出たりでなかったりがある
247名無しさん@お腹いっぱい。
2024/01/07(日) 08:45:36.21
相変わらずこの時間帯の Tor 経由でのアーカイブは厳しいw
あと 15 分待つか
248名無しさん@お腹いっぱい。
2024/01/08(月) 16:23:46.89
既出だったらスマン
アーカイブされたページ自体をユーザ側のアクションで検索エンジンのインデックスに登録することって可能なんかな

検索してみるといくつかの日本のサイトのアーカイブがGoogleにインデックス登録されてるんだよな
でもWaybackが自分でクロール申請したはずはないから何か方法があるんじゃないかと思ってる

例えば自分で立てたサイトにアーカイブへの直リンクを貼っておいて、自分のサイトをインデックス登録してリンク先をクロールさせるとか
249名無しさん@お腹いっぱい。
2024/01/09(火) 05:18:09.59
うまいことpixivのアーカイブ取る方法はないものか
250名無しさん@お腹いっぱい。
2024/01/09(火) 19:55:25.90
閉鎖したサイトを丸々コピーして稼いでる攻略サイトが増えてるわ
https://xneo.jp/
https://kouryaku7.com/
251名無しさん@お腹いっぱい。
2024/01/10(水) 07:22:01.53
うーむ
特定のホストにて、各 URL につき「一時間以上空けろ」ではなく
「一日一回のみアーカイブ可」ということか。
ちなみにホスト名は www.sqlite.org。
252名無しさん@お腹いっぱい。
2024/01/10(水) 11:46:54.75
そんなにSPNの条件厳しくなったのか
253名無しさん@お腹いっぱい。
2024/01/10(水) 15:40:19.81
昔このスレに居たスポーツ新聞野郎なら発狂してる事案w
254名無しさん@お腹いっぱい。
2024/01/10(水) 16:08:44.56
>>18によるとYouTubeは動画も保存される仕様とのことだけど
その仕様になったのは最近?
6~7年前にアーカイブされたYoutubeページに辿り着いたら
動画部分は保存されていなかった
255名無しさん@お腹いっぱい。
2024/01/11(木) 00:50:47.06
ログインしても数個取るとすぐログアウトさせられるのはおま環?
256名無しさん@お腹いっぱい。
2024/01/11(木) 02:24:05.23
クッキーを消した、有効期限切れ (一年間)、それ以外の原因でのログアウトは無いな。
257名無しさん@お腹いっぱい。
2024/01/11(木) 16:04:39.91
>>254
動画によって保存されてたりされなかったりする、基準は分からん
why:のところにyoutubecrawlが無いスナップショットは動画が保存されてない
258名無しさん@お腹いっぱい。
2024/01/12(金) 18:40:22.52
Save Page Now browser crashed on http://naenara.com.kp/main/index/ja/first.
259名無しさん@お腹いっぱい。
2024/01/14(日) 05:07:51.98
初めて目にしたかも
260名無しさん@お腹いっぱい。
2024/01/15(月) 00:29:16.40
IAで、ディレクトリ内のファイル名に対して検索をする方法ってある?
261名無しさん@お腹いっぱい。
2024/01/15(月) 00:29:45.25
IAで、ディレクトリ内のファイル名に対して検索をする方法ってある?
262名無しさん@お腹いっぱい。
2024/01/15(月) 00:30:15.98
ごめんダブった
263名無しさん@お腹いっぱい。
2024/01/15(月) 00:59:42.60
>>260-261
タイムスタンプ部分とディレクトリ名末尾に "*" とか
https://web.archive.org/web/*/www.sqlite.org/2023/*

検索対象の母数が一万件を超える場合は CDX Server API でリストを出してから
ローカルで抽出とか
http://2chb.net/r/esite/1628793497/332-333
264名無しさん@お腹いっぱい。
2024/01/15(月) 02:24:29.46
>>263
リプありがとうございます。
せっかく教えてくださったのに、自分の説明が足らなくて分からなかったのですが、やりたいことはこんな感じです

たとえば、↓のshow allを開くとディレクトリ内のコンテンツが表示されますが
その中のG71-VNW1013.isoを検索して見つける事はできますか?
https://archive.org/details/msi-afterburner-driver-and-utility

https://archive.org/search
に入力して検索をした場合、タイトルや説明欄しか拾わないので
どうしたものかと思っていました
265名無しさん@お腹いっぱい。
2024/01/15(月) 03:12:52.31
ファイル名での検索が可能なら、例えばこんなアップロードは
もっと閲覧数が増えているのではないかと思います。
https://archive.org/details/vps0000000000020160306
266名無しさん@お腹いっぱい。
2024/01/15(月) 11:04:23.01
>>265
そっか…ありがとうございましたm(_ _)m
267名無しさん@お腹いっぱい。
2024/01/15(月) 14:20:12.75
検索システムはもっと強化してほしいよなぁ
一度も閲覧されてない化石と化したアーカイブとか大量にありそう
まぁあまり強化するとDMCA案件が増えそうなので悩ましいけど
268名無しさん@お腹いっぱい。
2024/01/17(水) 09:51:54.39
ログインしても同時保存制限厳しい…(4つまで)
あと、一気にまとめて取得する方法ってないの?一個一個やってると面倒臭い
269名無しさん@お腹いっぱい。
2024/01/17(水) 18:53:45.11
4 つねぇ、どうしたのかしら。
https://web.archive.org/save/status/user
270名無しさん@お腹いっぱい。
2024/01/17(水) 19:26:47.07
>>268
[email protected] に電子メールを送信/転送するとメール中のURIをアーカイブした結果のメールが数~数十分後に返信されてくる
271名無しさん@お腹いっぱい。
2024/01/18(木) 00:05:13.23
「ウェブ魚拓」や「archive.today」では保存できるのに「wayback machine」ではできないということは、
Xは「wayback machine」を嫌がっているということか?

ウェブ魚拓
https://megalodon.jp/
archive.today
https://archive.md/
272名無しさん@お腹いっぱい。
2024/01/18(木) 00:12:17.43
別に今でもX保存できるけど
273名無しさん@お腹いっぱい。
2024/01/18(木) 00:59:42.30
>>272
保存した日付のところを見に行った?

たとえばこれ。


Saved 1 time January 13, 2024.
https://web.archive.org/web/20240000000000*/https://twitter.com/BasedMikeLee/status/1745945126793626064
https://megalodon.jp/2024-0117-2350-04/https://twitter.com:443/BasedMikeLee/status/1745945126793626064
https://archive.md/clxnV
https://twitter.com/thejimwatkins
274名無しさん@お腹いっぱい。
2024/01/18(木) 02:24:21.59
「保存」は出来てるよ、表示が崩れてるだけ
CTRL+Uでソースを見ればツイート内容は保存されてるのが分かる
275名無しさん@お腹いっぱい。
2024/01/18(木) 02:40:16.78
https://web.archive.org/web/20240117173332/https://twitter.com/googlejapan/status/1747091305128477149

これなんかは動画まで含めてちゃんと取れたことを確認した
https://twitter.com/thejimwatkins
276名無しさん@お腹いっぱい。
2024/01/18(木) 02:49:37.22
>>274
見られないなら保存した意味がない。
277名無しさん@お腹いっぱい。
2024/01/19(金) 21:26:20.93
インターネットアーカイブのブログ、ずっと同じ糖質に粘着されてるの笑う
それでも削除しないのは流石だがw
278名無しさん@お腹いっぱい。
2024/01/28(日) 01:57:58.03
スラドのアーカイブを取ろうと思ったら、このサイト記事一覧ページって無いのか?
ajaxでmore moreで辿るしか無いんだろうか・・・
もう終わりだよ
279名無しさん@お腹いっぱい。
2024/01/28(日) 02:34:53.07
>>278
日付別の一覧、例えば昨日 (2024-01-26) のストーリー一覧なら
https://srad.jp/story/24/01/26/
から
https://mobile.srad.jp/story/24/01/24/2339228/
https://mobile.srad.jp/story/24/01/24/2346248/
https://it.srad.jp/story/24/01/24/2351254/
https://srad.jp/story/24/01/25/1337233/
https://it.srad.jp/story/24/01/25/1340217/
・・・
と記事番号とカテゴリ名を含む URL は得られるかと思います。
280279
2024/01/28(日) 02:39:44.69
おっとそれは一昨日だったw
PC を UTC タイムゾーンで動かしているのでうっかり・・・
281名無しさん@お腹いっぱい。
2024/01/28(日) 09:17:36.54
>>273
https://web.archive.org/web/20240126113327/https://twitter.com/s96shiho/status/1723541214925029490

これもそうだけど、スマホでなら見られるのにPCだと見られないのはなぜだろうか?

>>275
それはPCでも見られた。
https://twitter.com/thejimwatkins
282名無しさん@お腹いっぱい。
2024/01/28(日) 13:04:59.85
>>279
すごい、ありがとう!
そのURLは気付かなかった。
しかし、ページングは無さそうだから1日1リクエストとしても日記タレコミ記事で3*365*年数 か・・・。
283名無しさん@お腹いっぱい。
2024/01/28(日) 15:30:54.71
あと3日半だから絶望的じゃん
284名無しさん@お腹いっぱい。
2024/01/28(日) 15:51:21.68
月曜日に発表があって週末が1回しかないって急すぎるよ。
しかもスラドってコメント欄がperlのajaxで読み込んでるからアーカイブだとまともに表示できないだろうし
285名無しさん@お腹いっぱい。
2024/01/29(月) 09:18:53.73
[email protected] に取得したいページのURL送ったんだけど、ほとんどError! Capture timed outになる・・・
これってサーバー重くて失敗したのかな?
286名無しさん@お腹いっぱい。
2024/01/31(水) 16:01:30.81
Save Page Now browser crashed
なんかエラー吐いて来るね・・・
取れてる奴もあるけど違いがわからん
287名無しさん@お腹いっぱい。
2024/01/31(水) 16:14:30.83
それ Linux バイナリをアーカイブさせると良く出くわすな。
force_get=on を指定すると問題無く行けてるから、おそらく
コンテンツをヘッドレスブラウザでレンダしようとして失敗してるんだと思う。
288名無しさん@お腹いっぱい。
2024/02/01(木) 05:22:38.32
Srad はアーカイブチームが動いてるって見たけど
個人でバックアップしている人もおるんか
289名無しさん@お腹いっぱい。
2024/02/01(木) 14:17:08.29
スラド閉鎖撤回したな
まぁ不安定な状況である事には変わらないからアーカイブはした方が良い
290名無しさん@お腹いっぱい。
2024/02/02(金) 15:14:07.28
The capture will start in ~1 hour, 1 minute because our service is currently overloaded.
また1時間後とか言われるようになっちゃった・・・
291名無しさん@お腹いっぱい。
2024/02/02(金) 18:58:54.38
個人的に巡回ソフトでアーカイブ出来てたシンプル極まりない頃が懐かしい
292名無しさん@お腹いっぱい。
2024/02/04(日) 09:19:08.45
Save Page Now browser crashed
ヤフオクのページを取得しようとすると出る
293名無しさん@お腹いっぱい。
2024/02/04(日) 12:09:51.36
アーカイブしても画像が保存されないのキツイな
昔から収集方法変えてないみたいだけど
運営陣は変えるつもりないんだろうか
色々相性問題とかあって変えられないのかな?
294名無しさん@お腹いっぱい。
2024/02/04(日) 12:32:11.99
>>293
大ぼら乙
295名無しさん@お腹いっぱい。
2024/02/04(日) 13:30:12.10
サイトによるのでは
296名無しさん@お腹いっぱい。
2024/02/04(日) 16:23:38.85
今でも画像はアーカイブ開いて取得しないといけない
297名無しさん@お腹いっぱい。
2024/02/04(日) 16:36:51.96
【2020 年頃まで】
画像の保存は完全にユーザ任せ
(クローラを使っていたり、或いは
普通のブラウザでも保存開始後にすぐ閉じたりすると保存されない)
【それ以降】
ヘッドレスブラウザを実装、ある程度の画像は同時にアーカイブできるようになった

>>293 の言う昔って、いつの話よ?
298名無しさん@お腹いっぱい。
2024/02/05(月) 21:56:56.61
動的サイトを取ろうとして取れないと勘違いしてるパターンじゃない?
画像は4年前から取れてるし、最近だと自動でアウトリンクまで辿ってくれるようになってるが
299名無しさん@お腹いっぱい。
2024/02/06(火) 10:29:25.54
Tor を使っていると、本当にいろんな体験ができるw
この時の出口ノードは 🇳🇴 185.243.218.61。
300名無しさん@お腹いっぱい。
2024/02/07(水) 01:46:05.35
Google検索のキャッシュリンクが廃止で過去のページが閲覧不可に
https://pc.watch.impress.co.jp/docs/news/1566730.html

>Googleは、検索結果ページで利用できたWebページのキャッシュへのリンクを削除した。

これまで検索結果の各Webページのキャッシュにアクセスできるリンクが用意されており、Webページの過去の状態や削除される前の状態などが確認できたが、このリンクが削除されたかたち。検索演算子「cache:」を使ったアクセスはまだ行なえるが、将来的にはこちらも利用できなくなる予定だという。

これにともないGoogleでは、キャッシュへのリンクに代わって、Internet Archiveへのリンクを追加したいとも考えているという。
301名無しさん@お腹いっぱい。
2024/02/08(木) 07:44:47.71
オープンになったことで話題のBlueskyはarchive.todayで昔のTwitterみたいにスレッド丸ごとアーカイブできるようだ。
ところがWayback Machineでは保存できないみたい。
302名無しさん@お腹いっぱい。
2024/02/08(木) 10:56:12.30
>>300
IAにリンク貼るならGoogleから多額の寄付金もらえそう
303名無しさん@お腹いっぱい。
2024/02/08(木) 11:50:26.63
とうとう古い端末から Archive.md が開けなくなってしまた。


>>300
回線が重い時テキストだけ読むので重宝だったのにGoogleキャッシュ廃止メチャク不便やん。
304名無しさん@お腹いっぱい。
2024/02/08(木) 12:15:36.70
流れをぶった切って済まんが
https://download.sysinternals.com/ 配下の URL にて >>251 に遭遇。

ソフトウェア配布サイトをターゲットにした措置だとは思うが
Sysinternals のようにファイル名にリビジョン番号を記載せず
同じ URL のまま中身を差し替えていくサイトでは、
短期間で更新が繰り返されると保存されないリビジョンが出てくる。
305名無しさん@お腹いっぱい。
2024/02/10(土) 16:54:28.54
This URL has been already captured 6 times today, which is a daily limit we have set for that host. Please try again tomorrow.
10回制限からなんか減った?
306名無しさん@お腹いっぱい。
2024/02/10(土) 17:13:12.85
6 回バージョン登場か。

>>305
その後ろの関係詞節、高校辺り出てれば充分読めると思うが?
中卒は知らん。
307名無しさん@お腹いっぱい。
2024/02/10(土) 21:36:47.45
>>306
いや以前は10回制限だったのに6回になったなってだけ
308名無しさん@お腹いっぱい。
2024/02/10(土) 22:21:20.99
>>307
個別に 1 回だけとか 6 回までとか指定されてるホストが出てきてるんだよ、
だから関係詞節も読めと言ってるの。
309名無しさん@お腹いっぱい。
2024/02/12(月) 13:36:03.14
Wayback Machineってdoc形式のファイルやdocx形式のファイルも保存できるんだね
ホント便利だな
310名無しさん@お腹いっぱい。
2024/02/12(月) 16:04:03.39
一日一回のみとか10回のみのエラーってAPIドキュメントには無いよね?
特別に指定されてるんだろうか
311名無しさん@お腹いっぱい。
2024/02/14(水) 16:25:56.42
X(twitter)はnitter.czにリンクを変えて、archive.todayにぶち込んで保存してる。
他にも方法あるかもしれんけど
312名無しさん@お腹いっぱい。
2024/02/15(木) 18:30:11.00
そういやnitterの開発終了したんだってな
今のところ動いてるインスタンスはあるけど、これからどうなんだろ
313名無しさん@お腹いっぱい。
2024/02/15(木) 23:04:23.48
これからどうやってtwitter保存すればいいんだろう
314名無しさん@お腹いっぱい。
2024/02/17(土) 01:09:16.83
youtubeの動画保存って無くなったのか?
youtubecrawlのコレクションは増え続けてるから動いてるはずなんだが、未だに保存されん・・・
国内メディアのニュース動画だからブロックされてる訳でも無いと思うんだがなぁ
315名無しさん@お腹いっぱい。
2024/02/17(土) 09:06:16.83
>>313
Twitter保存できるようになってましたよ
https://web.archive.org/web/20240216073841/https://twitter.com/elonmusk/status/1757474164850798632
https://web.archive.org/web/20240216154723/https://twitter.com/elonmusk/status/1757840768923021363
https://web.archive.org/web/20240217000150/https://twitter.com/elonmusk/status/1757924482885583112
https://twitter.com/thejimwatkins
316名無しさん@お腹いっぱい。
2024/02/17(土) 18:37:04.84
>>315
ホンマや
317名無しさん@お腹いっぱい。
2024/02/21(水) 03:43:18.85
>>281 が PC でも見られる、ってことは保存し直しの必要は無しか。
しかしアーカイブの表示内容が変化するってのは、別の意味で気持ち悪い。
318名無しさん@お腹いっぱい。
2024/02/21(水) 16:29:14.97
ページ数、なかなか9000億超えないな
319名無しさん@お腹いっぱい。
2024/02/21(水) 17:19:47.55
今もだけど、たまにアーカイブ数が減るのは何なんだろうか
しばらくすると元に戻るけど
320名無しさん@お腹いっぱい。
2024/02/21(水) 21:40:13.97
取得時間がまた2時間とか伸びて面倒
321名無しさん@お腹いっぱい。
2024/02/24(土) 02:00:32.15
ヘッダー部分の下からが表示されないんだねど自分だけかな。キャッシュ消したり再起動しても直らん
322名無しさん@お腹いっぱい。
2024/02/26(月) 16:37:22.05
>>321
サイトが重いとそうなる
その場合でもhttps://web.archive.org/saveに直接飛べば保存できたりする
323名無しさん@お腹いっぱい。
2024/03/03(日) 13:23:54.98
ブルースカイは、アカウントの設定(ログアウトしたユーザーからの可視性)よっては取得できないから注意
324名無しさん@お腹いっぱい。
2024/03/03(日) 16:09:52.87
セッションハイジャック耐性の無いサイトなら
capture_cookie パラメータ辺り使えば行けるんだけどなぁ
325名無しさん@お腹いっぱい。
2024/03/03(日) 23:23:39.94
数日前からtodayの調子が悪くて調べたらcloudflareDNSと相性悪いのか
326名無しさん@お腹いっぱい。
2024/03/04(月) 06:55:51.29
ページを保存させて完了画面も確認したのに、そのページが表示されないな
カレンダー形式の一覧に反映されるまでにはこれまでも時間がかかっていたけど
保存ページ自体が数十分待っても出てこないのは初めて
327名無しさん@お腹いっぱい。
2024/03/04(月) 07:06:56.05
今もう一度見てみたら、既にカレンダー形式の日付には青丸が付いているのに
さっき保存した保存時刻(UTC)をクリックしてもその内容が表示されないという現象が起きてる
328名無しさん@お腹いっぱい。
2024/03/04(月) 14:03:06.47
最近はよくある
半日くらい待つと出てくる
329名無しさん@お腹いっぱい。
2024/03/05(火) 17:33:40.00
i.imgur.comのページは一瞬で保存できるのなんでなんだろ
330名無しさん@お腹いっぱい。
2024/03/05(火) 19:50:05.76
>>329
1. 対象 URL に HEAD リクエストを投げる。

2. レスポンスヘッダから単一の画像ファイルであることを検知。
(Content-Type: image/jpeg 等)

3. ヘッドレスブラウザは不要と判断、後回しにせず即アーカイブ作業に移る。

対象が HTML の場合は後回しにされることが多いが、おそらく
ヘッドレスブラウザで HTML をパースして追加の画像等を拾ってきたり、
JavaScript を実行させる必要があるなど負荷が重いから。
HEAD リクエストが送られる件については >>3 のドキュメントの force_get の項を参照。
331名無しさん@お腹いっぱい。
2024/03/06(水) 01:49:37.87
ニコニコ動画のフォロワー欄が途中までしか保存されない問題ってどうすれば解決できますか?

www.nicovideo.jp/user/23396749/follow/follower

https://archive.is/4Efzj

上記のユーザーならフォロワーは僅か40なので情報量が大きすぎるという訳でもないはずなのですが
332名無しさん@お腹いっぱい。
2024/03/10(日) 15:14:50.96
5chのnovaサーバーだけ取れなくなってる?
333名無しさん@お腹いっぱい。
2024/03/10(日) 15:18:40.98
今日調子悪い?
334名無しさん@お腹いっぱい。
2024/03/10(日) 15:18:44.98
今日調子悪い?
335名無しさん@お腹いっぱい。
2024/03/10(日) 15:35:56.28
>>332
>>73

>>333-334
capture_outlinks=on にしても全然 outlinks を拾ってくれないね、それ以外は知らん。
336名無しさん@お腹いっぱい。
2024/03/10(日) 19:42:19.84
https://nova.5ch.net/livegalileo/
https://nova.5ch.net/novatr/
各板のトップは国外から見られるが、個別スレを開こうとすると 520 エラーが返る。
Internet Archive のサーバは米国にあるから当然エラーとなる。
337名無しさん@お腹いっぱい。
2024/03/11(月) 01:13:22.82
今日は一日繋がらなかったな
338名無しさん@お腹いっぱい。
2024/03/11(月) 21:15:52.76
>>331
じゅんじゅ@\( ・ω・)/ www.nicovideo.jp/user/41124243
元グリーンベレー user/13675361 ・ lalala user/2765923
蘭‐Ran‐ user/18878661 ・ めざすくん user/27507212
わるよい user/3953893 ・ ゆ〜の user/2915294
sou user/11352489 ・ モッチチ user/6511183 ・ 海鼠 user/4114082
339名無しさん@お腹いっぱい。
2024/03/11(月) 21:21:31.64
イモグラの画像、保存できてない時有るな
340名無しさん@お腹いっぱい。
2024/03/15(金) 02:19:07.21
ビタミーナ王国物語以外でイモグラなんてワードを見かけるとは夢にも思わなかった
341名無しさん@お腹いっぱい。
2024/03/15(金) 03:07:50.06
【保存・記録】ウェブアーカイブ総合 Page.02
http://2chb.net/r/internet/1700519014/
342名無しさん@お腹いっぱい。
2024/03/15(金) 16:03:39.90
imgur 画像のリファラ検査が始まり、直リンが禁止されてアーカイヴできなくなった。
Internet Archive総合 (web.archive.org) #5 YouTube動画>3本 ->画像>69枚

https://imgur.com/8oRShxz
ページ内の埋め込み画像はリファラが送られるが、この URL では駄目。

https://imgur.com/8oRShxz/embed
この URL のアーカイヴを保存させればよい。

結果
Internet Archive総合 (web.archive.org) #5 YouTube動画>3本 ->画像>69枚
343名無しさん@お腹いっぱい。
2024/03/16(土) 14:31:32.48
>>342
その方法を今試してみたけど保存できてないよ。
保存したファイルと元のファイル比較してみれば分かるけど解像度もファイルサイズも違うしURL末尾辺りに謎の小文字lが付加されてる。
344342
2024/03/16(土) 15:04:21.21
>>343
あーほんとだ、気付かんかった

8oRShxz
8oRShxzl

何か良い方法は無いかな
345名無しさん@お腹いっぱい。
2024/03/17(日) 02:41:47.70
dotupがやたらと嫌われてたけど俺はimgurの方が嫌いだわ( ´_ゝ`)
346名無しさん@お腹いっぱい。
2024/03/20(水) 18:03:48.97
Loadingでずっと進まないんだけど
今archive.todayってTwitter保存できないの?
archive.orgの方は出来るみたいだけど
アドレスが長くなるからtodayの方を使いたい

>>342
関係ないけど
リファラ検査で出始めたJaneのimgurサムネイルエラーは
http://2chb.net/r/software/1708963746/185n
で回避した
347名無しさん@お腹いっぱい。
2024/03/20(水) 18:47:49.51
>>346
なんだ山下の犬か
348名無しさん@お腹いっぱい。
2024/03/22(金) 05:15:15.83
NHKが運営するネット上の特設ページ、続々と運営終了。放送法改正を見据えた動きか

https://internet.watch.impress.co.jp/docs/yajiuma/1577805.html

2024年4月1日10:00をもちまして、以下特設ページの掲載を終了(番組ストリーミングを含む)いたします。(NHKゴガク)
https://www.nhk.or.jp/gogaku/
NHK、「政治マガジン」など6サイト更新停止へ 新サービスを検討(朝日新聞デジタル)
https://www.asahi.com/articles/ASS375VHPS36UCVL04P.html
NHKやばいな。どんどんデジタルサービス終了させている。声調確認くんとか、凄く良かったのに。デジタル頑張っていた中の人たちが気の毒。(Togetter)
https://togetter.com/li/2334548
349名無しさん@お腹いっぱい。
2024/03/23(土) 15:57:54.15
特許や意匠権の参考文献にURLが記載されてる事って多いんだけどさ
昔のホームページだと404かつ何処にもアーカイブされてないとかざら何だよな
せめてその辺は国がアーカイブしないと将来的に困ったことにならんのか?と思う
350名無しさん@お腹いっぱい。
2024/03/23(土) 18:36:41.16
今死んでるな?
351名無しさん@お腹いっぱい。
2024/03/23(土) 20:47:29.68
>>349
この国の政府って困ったことに未来にも過去にも興味が全くないですよ
352名無しさん@お腹いっぱい。
2024/03/24(日) 02:26:23.04
>>349
WARPでアーカイブしてるよ
https://warp.da.ndl.go.jp/
353名無しさん@お腹いっぱい。
2024/03/24(日) 13:22:02.87
>>352
これ特許庁自体は保存されてるけど、参考文献URLまで保存されてるってどこかに書いてある?
354名無しさん@お腹いっぱい。
2024/03/25(月) 09:41:34.78
Internet Archive総合 (web.archive.org) #5 YouTube動画>3本 ->画像>69枚
なぜか "Save Page Now" の前のアイコンが
https://archive.org/about/404.html へリダイレクトされてしまっている。
355名無しさん@お腹いっぱい。
2024/03/28(木) 12:58:45.39
現在繋がらない?
356名無しさん@お腹いっぱい。
2024/03/28(木) 13:00:30.23
15分くらい前まで繋がってたけど今は繋がらないね、Temporarily Offlineだからメンテ中かな
357名無しさん@お腹いっぱい。
2024/03/28(木) 13:39:19.92
https://twitter.com/textfiles/status/1773203790159565077
また停電だってよ去年もあったね
https://twitter.com/thejimwatkins
358名無しさん@お腹いっぱい。
2024/03/28(木) 14:33:39.21
503エラーちょこちょこ出るけど、復帰したね乙でした
359名無しさん@お腹いっぱい。
2024/03/28(木) 15:36:57.20
Queue-Itの待合室経由みたいに、いったんリダイレクトされてJavascript動作してから本サイトにリダイレクトされるようなサイトはどうやってアーカイブするの?
save page nowではなくて、自PCでアクセスして表示したページをそのままアーカイブできる機能とかあればしりたい。
360名無しさん@お腹いっぱい。
2024/03/29(金) 09:32:43.89
詐欺紛いのサイトがアーカイブを徹底的に拒否しているのは笑える
https://www.sotwe.com/DuceTCG
361名無しさん@お腹いっぱい。
2024/03/29(金) 09:45:43.27
>>360
拒否してるのはサイトじゃなくてTwitterWebViewerの方だった。俺の勘違い
362名無しさん@お腹いっぱい。
2024/03/29(金) 09:53:56.79
>>360
こっち見たらええやん
https://x.com/DuceTCG
363名無しさん@お腹いっぱい。
2024/04/01(月) 14:58:37.43
UAによって弾いてるぽい
364名無しさん@お腹いっぱい。
2024/04/02(火) 02:31:48.54
imgur、画像の直リンは無理だとしても postpagebeta=0 というクッキーを食べたことにして
こういうアーカイブを取れば行けるなぁ。
つまり capture_cookie パラメータを使用。
https://web.archive.org/web/1/imgur.com/EwuqXZU
365名無しさん@お腹いっぱい。
2024/04/02(火) 02:48:58.54
これは失敗。
https://web.archive.org/web/1/imgur.com/sBfrwVv
imgur でアダルト判定を食らった画像を表示させて "Yes, I'm over 18" をクリックしたときに追加されるクッキーの中に
over18=1 ってのがあるけど、それも食べたことにすれば行けるかな。
366名無しさん@お腹いっぱい。
2024/04/02(火) 02:59:57.86
おお、行けた行けた。
https://web.archive.org/web/1/imgur.com/fb5LVDx
367名無しさん@お腹いっぱい。
2024/04/02(火) 15:12:43.62
SPNではできないやつ?
368名無しさん@お腹いっぱい。
2024/04/02(火) 19:17:02.33
どうも postpagebeta=0 のクッキーだけ送っておけば、
リファラ無しの画像直リンでも OK っぽいな。

>>367
スクリプト使うのも Save Page Now のページを使うのも、やってる事は全く同じなんだけど
後者では入力できないパラメータを送る必要があるんだよね。
https://web.archive.org/save/ を表示させて、次のブックマークレットで入力欄を追加してから
上の欄に imgur の画像 URL、下の欄に postpagebeta=0 を入力してボタンを押せば
たぶん保存できる。
https://pastebin.com/uEZ1Dbqi
369インターネットアーカイブ
2024/04/02(火) 23:58:17.49
>>368
サンクス。保存できたっぽい
こんな荒技があったとは
370名無しさん@お腹いっぱい。
2024/04/04(木) 04:15:40.02
>>368
保存できていたのに保存できなくなったぽい?
371名無しさん@お腹いっぱい。
2024/04/04(木) 05:45:40.47
えっ
Internet Archive総合 (web.archive.org) #5 YouTube動画>3本 ->画像>69枚
372名無しさん@お腹いっぱい。
2024/04/04(木) 13:26:28.62
imgur の画像直リンが、クッキーを付けてあってもリダイレクトされるようになってしまったかも。
それでも拡張子の無い https://imgur.com/xxxxxxx 形式の URL を
クッキー付きでアーカイブさせれば、画像にはリファラが送られるので保存はできている。
373名無しさん@お腹いっぱい。
2024/04/06(土) 22:10:26.61
Resources (ページ内画像等) としてアーカイブされた URL がカレンダ表示に登場するまでに
時間が掛かってる
374名無しさん@お腹いっぱい。
2024/04/07(日) 12:36:44.17
APIでリファラも送れるようにしてくれないかな
cookieやUAは送れるのにリファラは対応してないの何で?
375名無しさん@お腹いっぱい。
2024/04/07(日) 16:46:14.94
間違った転送先を保存してしまい何故か修正できないヤツ
https://web.archive.org/web/20240407072915/https://i.imgur.com/UtKDI8X.jpeg
アニメ絵と実写エロ注意
376名無しさん@お腹いっぱい。
2024/04/07(日) 17:16:13.24
大文字小文字違いかw
uTKdi8x
UtKDI8X
377名無しさん@お腹いっぱい。
2024/04/08(月) 16:06:38.65
archive.today
数日前からX(旧Twitter)のアーカイブできなくなってる?
378名無しさん@お腹いっぱい。
2024/04/09(火) 18:51:29.66
>>377
自分も、ここ最近X(旧Twitter)のアーカイブが取得できなくて困ってる。
379名無しさん@お腹いっぱい。
2024/04/10(水) 21:37:00.24
404だ
380名無しさん@お腹いっぱい。
2024/04/14(日) 14:05:36.49
Not Found
The requested URL was not found on the server. If you entered the URL manually please check your spelling and try again.
381アーカイブ
2024/04/15(月) 06:08:58.29
またイモグラ保存できなくなったんじゃないだろうな
もうイモグラは使わないでくれ
382名無しさん@お腹いっぱい。
2024/04/15(月) 11:30:27.65
ふむふむ
Internet Archive総合 (web.archive.org) #5 YouTube動画>3本 ->画像>69枚
383アーカイブ
2024/04/15(月) 14:34:30.98
OutLinksを使うと保存できてる時もあるっぽいな。
これが原因か?
384アーカイブ
2024/04/15(月) 16:54:08.33
いや関係無いっぽいな。
試しにスクリプトが上げてるグ□画像を保存してみたらOutLinksなんて無くても一発で取れた。
取れる画像と取れない画像があるのか?
385名無しさん@お腹いっぱい。
2024/04/15(月) 21:48:34.29
ゲッ、いつの間に同一URLの保存回数が一日5回までに減ってやがる…
https://web.archive.org/web/0im_/https://files.catbox.moe/xei3k9.PNG
19年の頃は保存回数制限もなく保存再開出来る時間も10分間隔だったんだがなぁ…
386名無しさん@お腹いっぱい。
2024/04/15(月) 21:58:25.42
>>385
>>305-308
さらに少なく、一日一回だけに制限しているホストもあるからね。
387アーカイブ
2024/04/16(火) 08:03:08.50
保存回数上限がホスト毎に決められているけど、回数はURL毎に数えているってことか。
388名無しさん@お腹いっぱい。
2024/04/17(水) 02:34:56.23
自分がアーカイブを取ってるサイトは大概 1 回だけなんだよなぁ。
389名無しさん@お腹いっぱい。
2024/04/19(金) 22:35:13.33
そろそろやばいやばいっていわれてるけど、Archive.liがなくなる事ってあるのかね。
そもそもあいつの資金源どうなってんだ?
390名無しさん@お腹いっぱい。
2024/04/19(金) 22:39:26.28
運営費がかさむかさむって言ってたし、ロシアでの運営じゃ厳しいだろ。
国を出ないなら、このまま吹き飛びそうだな。
391名無しさん@お腹いっぱい。
2024/04/20(土) 13:11:21.35
【質問】Wayback machineで既に誰かがウェブサイトをアーカイブしていたときサイトのアーカイブは更新されるのか

拡張機能web archivesでwayback machineを選択する→既にアーカイブされている1年前のものが表示される

画像などが保存されていないので現在の最新の状態で完全なものをアーカイブしたいんですが可能なんですかね?やり方がわかりません
gyazo.com/2dea0146024edc6952878c8d25b9b572
392名無しさん@お腹いっぱい。
2024/04/20(土) 13:57:11.01
Wayback machineで除名を申し入れされたとして、
それはそのウェブサイトは見かけ上保存はできてそうなんだけど閲覧できないだけ?
そのドメインを後から手に入れる事ができ、除名を解いたら、それまでに保存を要請してきたウェブサイトを見る事ができるようになると?
393名無しさん@お腹いっぱい。
2024/04/20(土) 13:57:11.53
Wayback machineで除名を申し入れされたとして、
それはそのウェブサイトは見かけ上保存はできてそうなんだけど閲覧できないだけ?
そのドメインを後から手に入れる事ができ、除名を解いたら、それまでに保存を要請してきたウェブサイトを見る事ができるようになると?
394名無しさん@お腹いっぱい。
2024/04/20(土) 15:31:34.61
>>391-393
アホー知恵袋にでも行って質問なさい、おじいちゃん
https://chiebukuro.yahoo.co.jp/
395名無しさん@お腹いっぱい。
2024/04/23(火) 19:37:25.85
アーカイブチーム、いや、いつもアーカイブしている人たちは全員本当にやる気を感じない
YouTubeの動画のページが公開された時、すぐに保存されないケースが多いし。
396名無しさん@お腹いっぱい。
2024/04/23(火) 20:04:37.85
>>395
「アーカイブ」ってまだちゃんと覚えてられてるんだw
>>130-131
397名無しさん@お腹いっぱい。
2024/04/29(月) 03:17:02.51
あー重い重い
398名無しさん@お腹いっぱい。
2024/04/29(月) 19:58:05.90
https://www.courts.go.jp/app/files/hanrei_jp/995/088995_hanrei.pdf
グリーの弁護士、Wayback MachineのURL日付部分を日本時間基準だと勘違いして日付が一致しないとか言ってて草
検証の部分でUTC時間だから問題ないとちゃんと反論されていてよかった、ついでに裁判も負けてる
399アーカイヴ
2024/04/30(火) 22:20:03.49
さっきまでめっちゃ調子よかったのに503
400名無しさん@お腹いっぱい。
2024/04/30(火) 22:42:01.31
てかメンテの表示出てるじゃん。今夜はもう無理かな。

>>391 URLをそのままSPNで保存すればいいよ。そうすれば日付違いで保存されて表示されるはず。
>>392-393 前のドメイン権利者が除外要請を出した時と連絡先など一致してなかったり譲渡されたと嘘付いても、解除通るの?
>>395 ArchiveTeamの巡回を待ってるなら、自分でSPNから保存したほうが早いよ。動画ファイルも半分ぐらいの確率で保存してくれる。
削除予告が出ていて緊急なら#down-the-tubeのチャットで理由書いてコマンド打てばいい。量が多いと完璧に保存されないけど失うよりはいいし。両方やっとけば残る確率高くなる。
>>396 てか>>130で文句言ってるXGeNeLWnYdcの動画ファイル保存されてないね。昨日試しにSPNで保存したけど1日経ってもファイル保存されてねえわ。
401名無しさん@お腹いっぱい。
2024/04/30(火) 22:42:04.16
てかメンテの表示出てるじゃん。今夜はもう無理かな。

>>391 URLをそのままSPNで保存すればいいよ。そうすれば日付違いで保存されて表示されるはず。
>>392-393 前のドメイン権利者が除外要請を出した時と連絡先など一致してなかったり譲渡されたと嘘付いても、解除通るの?
>>395 ArchiveTeamの巡回を待ってるなら、自分でSPNから保存したほうが早いよ。動画ファイルも半分ぐらいの確率で保存してくれる。
削除予告が出ていて緊急なら#down-the-tubeのチャットで理由書いてコマンド打てばいい。量が多いと完璧に保存されないけど失うよりはいいし。両方やっとけば残る確率高くなる。
>>396 てか>>130で文句言ってるXGeNeLWnYdcの動画ファイル保存されてないね。昨日試しにSPNで保存したけど1日経ってもファイル保存されてねえわ。
402名無しさん@お腹いっぱい。
2024/04/30(火) 22:49:38.87
>>387
そういえば、ちょっと前にyoutube.comの1日の保存上限で8万回?ってエラー出てた。2年ぐらい前にエラー出た時はもっと数字が大きかった気がするけど。
確実に保存したいなら上限がリセットされるはずの日本時間午前9時から早い者勝ちで保存するしかないみたいだが。
403名無しさん@お腹いっぱい。
2024/05/02(木) 16:55:42.41
>>401
130の動画なら保存されてるのでは?
youtubecrawlのコレクションに入ってるが
404名無しさん@お腹いっぱい。
2024/05/04(土) 11:12:18.18
Tor Browser が Internet Archive の .onion 版が利用可能と検出してるけど
繋がらないんだよね・・・コード 0xF2 のエラーが返る
https://archive6zg5vrdwm4ljllgxleekeoj43lqayscd4d4kmhnyblq4h3ead.onion/
405名無しさん@お腹いっぱい。
2024/05/04(土) 12:01:16.02
またメンテか
次はいつ復旧するのやら
406名無しさん@お腹いっぱい。
2024/05/04(土) 15:36:31.33
>>403
今見てみたら、動画ファイルの保存まではできてないみたい。

確認用コード
curl -I "https://web.archive.org/web/2oe_/http://wayback-fakeurl.archive.org/yt/img/XGeNeLWnYdc"
ターミナルで動かしてヘッダー部分だけ取得すると、転送先の動画ファイルURLがlocation:として出てこないで404エラーになってる。
保存されていればgooglevideo.comの長いURLが出てくるはず。保存されるまで何度かSPNで保存繰り返せばいいけど。
407名無しさん@お腹いっぱい。
2024/05/04(土) 15:36:33.70
>>403
今見てみたら、動画ファイルの保存まではできてないみたい。

確認用コード
curl -I "https://web.archive.org/web/2oe_/http://wayback-fakeurl.archive.org/yt/img/XGeNeLWnYdc"
ターミナルで動かしてヘッダー部分だけ取得すると、転送先の動画ファイルURLがlocation:として出てこないで404エラーになってる。
保存されていればgooglevideo.comの長いURLが出てくるはず。保存されるまで何度かSPNで保存繰り返せばいいけど。
408アーカイヴ
2024/05/05(日) 15:10:31.41
Save Page Now browser crashed on https://imgur.com/p5BPbjq.
409名無しさん@お腹いっぱい。
2024/05/05(日) 16:04:43.50
何回か連打してればバックグラウンドで保存に成功するケースが殆ど。
410名無しさん@お腹いっぱい。
2024/05/06(月) 15:54:44.08
archive.todayってMicrosoftのサーバー経由してるのなんで?
MSのサーバーをhostsで遮断したら保存できなくなった
411名無しさん@お腹いっぱい。
2024/05/06(月) 21:39:08.18
>>7
quoraもサルベージできない
412名無しさん@お腹いっぱい。
2024/05/11(土) 14:20:52.07
全然違うfaviconが表示されるのってなんなんだろ
413名無しさん@お腹いっぱい。
2024/05/12(日) 00:23:05.21
なんだこのエラー?
task_id must not be empty. Got None instead.
414名無しさん@お腹いっぱい。
2024/05/12(日) 15:27:19.16
archiveのアニメをWEBで見てたがすごく遅くて適当にVPNで日本で見たらすぐ見れた

IP規制してる??
415名無しさん@お腹いっぱい。
2024/05/16(木) 18:03:20.05
X(twitter)やインスタを保存するのにオススメの方法があったら教えて。
416名無しさん@お腹いっぱい。
2024/05/16(木) 18:57:43.42
すみません。
twitterアカウントを削除する前に、ツイート削除した場合、該当のツイートは見ることできますか??
417名無しさん@お腹いっぱい。
2024/05/16(木) 19:53:45.33
>>415
スクショ
WEBアーカイブ
>>416
見れない
しかし動画や写真のURLさえわかればツイート削除後でも一定期間閲覧可能
418名無しさん@お腹いっぱい。
2024/05/16(木) 20:01:40.36
>>417
ありがとうございます!
419名無しさん@お腹いっぱい。
2024/05/19(日) 09:47:52.15
Amazonの商品ページの過去を見ることできますか?
420名無しさん@お腹いっぱい。
2024/05/24(金) 14:58:58.03
>>419
見れる(保存されていれば)
421名無しさん@お腹いっぱい。
2024/05/27(月) 03:27:05.36
今落ちてるか?
422名無しさん@お腹いっぱい。
2024/05/27(月) 03:40:50.05
/save/status 以下の状態取得 API が生きてたりしてるけど他は 503
まぁそんな事もあるさ
423名無しさん@お腹いっぱい。
2024/05/27(月) 20:03:17.06
現在503になって繋がらないけど他の方々はどうだろうか?
424名無しさん@お腹いっぱい。
2024/05/27(月) 23:01:42.52
一瞬繋がったり503に戻ったり
ダメな日だね
425名無しさん@お腹いっぱい。
2024/05/28(火) 00:17:54.53
>>420
確かに昔ブックマークしたのは見れた。
426346
2024/05/28(火) 01:43:54.31
最近archive.orgは繋がらないことが多いな

imgurの直リンはarchive.orgでは不可だったけど
archive.todayでは問題なく撮れた

ここ今、運営が頭狂でURLが貼れなくなってるね
427名無しさん@お腹いっぱい。
2024/05/28(火) 03:39:21.51
>>185
https://kakaku.com/tv/
テレビ紹介情報は2024年5月30日をもちましてサービスを終了いたします。

アーカイブ必須だな
428名無しさん@お腹いっぱい。
2024/05/28(火) 04:04:36.99
テレビ、ねぇ。
あまり見んからなぁ・・・
429名無しさん@お腹いっぱい。
2024/05/28(火) 11:08:33.41
Yahoo!テレビの番組コメは長年特別扱いのテレ東もしっかり叩かれてたのが良かったのに3月で終わってしまった
430名無しさん@お腹いっぱい。
2024/05/28(火) 22:27:45.16
昨日繋がらなかったのはどうやらDDOS攻撃食らってたからみたいね
https://gigazine.net/news/20240528-internet-archive-under-ddos-attack/
そして今現在また503や504になってるがまたDDOS攻撃食らってるのか…?
431名無しさん@お腹いっぱい。
2024/05/28(火) 22:59:38.15
今日は増しだと思ったら結局
もはや「まぁそんなことも」なんてレベルではない
432名無しさん@お腹いっぱい。
2024/05/28(火) 23:45:39.54
なんでこの時期に突然DDOS…
433426
2024/05/28(火) 23:55:23.08
>>430
https://x.com/internetarchive/status/1795451463465845141
Internet ArchiveのTwitterを見れば状況が判ったな

archive.orgで撮れなくてarchive.todayで撮れるサイトが近頃多い
Instagramもarchive.orgでは不可だったけど
archive.todayでは問題なく撮れた
434名無しさん@お腹いっぱい。
2024/05/29(水) 00:14:52.44
>433
使い方の差ではあるのだろうが個人的にはwebarchiveで出来てtodayで出来ない点として
・大容量zip等とかが保存可能かどうか(todayじゃそもそもzipどころかmp4やmp3すら保存出来なかったような…)
・検索エンジンで足がつくか否か(todayの場合割りと簡単に足がつきやすい)
・そしてwebarchiveで言う所のSave outlinks機能があるかどうか
というのが引っかかってね…(ほぼ鯖側に負担がかかるのばっかじゃねえかって話ではあるが…)
435名無しさん@お腹いっぱい。
2024/05/29(水) 02:47:36.00
today運営の素性がわからんしいつ消えるかもわからんしなー
436名無しさん@お腹いっぱい。
2024/05/29(水) 03:00:41.86
>>427
ギャーーーー!!これ今知った!!!
こういうのも貴重な情報だったのに…なんてこった。・゜・(ノД`)・゜・。

でた蔵はちょくちょく、表からのリンク先のページが無かったりするし
起こされた内容もだいぶ偏ってて不完全なのがどうもなあ…
437 警備員[Lv.2][新芽]
2024/05/29(水) 03:54:52.06
wayback-gsheetsにアップデートはいってて驚いた
438433
2024/05/29(水) 07:19:08.25
>>434
archive.orgで撮って
撮れなかったらarchive.todayを使ってる
todayで撮れてorgで撮れないってどうなのかなって

>>435
それが問題
魚拓サイトなのに魚拓サイトが消えたら元も子もないw
todayはドメインが代わったりして大丈夫なのか感がある

archive.todayはURLがarchive.orgみたいに長くならないのが
5chなんかで使う時には良かったりもする

archive.orgを利用してて思うのは、
全く同じキャプチャが重複して何個も何個も撮られてて無駄だなって事と
セーブ時のSave error pages (HTTP Status=4xx, 5xx)の☑はデフォルト外しといた方が良いんじゃないかって事
439名無しさん@お腹いっぱい。
2024/05/29(水) 07:39:31.64
視野が狭いな
440438
2024/05/29(水) 07:45:49.70
>>439
具体的に言ってくれる?
参考にしたい👁
441名無しさん@お腹いっぱい。
2024/05/29(水) 20:22:01.58
todayのURL、916132832超えたらどうなるの
442名無しさん@お腹いっぱい。
2024/06/01(土) 15:39:13.02
>>441
アルファベットが6桁になる、今の所は半分程度が使用されてるって数年前のブログに書いてた気がする

てかtodayって毎月30万近くかかってるらしいんだが、どうやって個人で維持できてるのか謎すぎるな・・・
443名無しさん@お腹いっぱい。
2024/06/04(火) 19:32:52.16
度々すみませんm(_ _)m
一部のツイートを削除してからTwitterアカウントごと削除した場合、waybackmachineに収集されていれば削除した一部のツイート内容も見ることできますか??
444名無しさん@お腹いっぱい。
2024/06/04(火) 20:38:01.07
>>443
削除前に保存されてれば見れる
ただそのツイートのURLが分からないとダメなので、URLを忘れたら事実上誰も見れなくなる
445名無しさん@お腹いっぱい。
2024/06/05(水) 23:25:18.82
少なくともXに関してはtodayで取れるようになった
446名無しさん@お腹いっぱい。
2024/06/06(木) 00:33:39.47
https://archive.is/XV7ro
Web.archive.org is DOWN for everyone.
447名無しさん@お腹いっぱい。
2024/06/09(日) 06:35:08.16
いつの間にかx.fc2が取れなくなってるし…最悪
448名無しさん@お腹いっぱい。
2024/06/09(日) 19:25:53.07
えっちなコンテンツが後世に残らなくなってしまう・・・
449名無しさん@お腹いっぱい。
2024/06/12(水) 21:05:59.49
そろそろアップデートして欲しいなぁ、今風のサイトは取れないのが多くなってきた
450438
2024/06/13(木) 03:57:29.35
archive.todayでもTwitter(𝕏)が
>Something went wrong. Try reloading.
で記録されてしまって撮れなくなった模様

Twitterは、archive.orgで撮ってたのが見れなくなってたりしない?
表示されないのが多過ぎる気がする

Facebookは
archive.todayは撮れて
archive.orgでは撮れなかった

>>449
以前は普通に撮れてたのに
現在は撮れないサイトが多すぎるんだヨネ
451名無しさん@お腹いっぱい。
2024/06/13(木) 07:49:52.66
特殊な構造のサイトが増えているということなんだろうな
452名無しさん@お腹いっぱい。
2024/06/13(木) 17:33:20.62
Save Page Now could not capture this URL because it was unreachable.
453名無しさん@お腹いっぱい。
2024/06/15(土) 02:11:44.72
youtubeの動画は取れてるんだけど、コメントが全然関係ない動画のやつになっている
454名無しさん@お腹いっぱい。
2024/06/15(土) 02:36:09.67
それ、あるある
455名無しさん@お腹いっぱい。
2024/06/18(火) 20:40:38.93
今日はだめな日
456名無しさん@お腹いっぱい。
2024/06/18(火) 21:16:17.10
なんか新規取得しないな・・・
457名無しさん@お腹いっぱい。
2024/06/19(水) 03:18:53.35
>>448
別にその方面に限ったことではない

>>456
後で無事取得できてるならまだ良いが、取得できてなかったら悲惨
458名無しさん@お腹いっぱい。
2024/06/19(水) 06:13:43.42
無くなる前にアーカイブ
過去ログ見れなくなる前にやっとけばよかったんだがね
Internet Archive総合 (web.archive.org) #5 YouTube動画>3本 ->画像>69枚

無くなったら無くなったでURLがわからないと辿れないから
過去ログβが無くなったら辿るのが困難になるのが困るな
一周回ってリンク集の需要が高まるかもしれない
459名無しさん@お腹いっぱい。
2024/06/19(水) 16:14:18.56
獣姦する女・・・(;`・д・´)
460名無しさん@お腹いっぱい。
2024/06/20(木) 02:48:05.92
もうずっと不調
461名無しさん@お腹いっぱい。
2024/06/21(金) 20:47:09.19
Twitterのプロフィールまではいけるんだが、そこから画像欄とかいいね欄が見られないのは仕様?
Something went wrong. Try reloading.のエラーが出て不便
462名無しさん@お腹いっぱい。
2024/06/21(金) 23:28:06.31
502 Bad Gateway
463名無しさん@お腹いっぱい。
2024/06/22(土) 00:35:46.03
>>461
そもそもログインしないと見れなくね?
464名無しさん@お腹いっぱい。
2024/06/23(日) 16:16:15.54
ここもかぁ
465名無しさん@お腹いっぱい。
2024/06/24(月) 10:17:35.84
見たいWebページが「404エラー」になっていたとき、元のページ内容を見る方法はないの?
https://otona-life.com/book/235219/
466名無しさん@お腹いっぱい。
2024/06/25(火) 23:46:25.84
ファイルの形式による一日の保存回数制限。
467名無しさん@お腹いっぱい。
2024/06/27(木) 21:46:14.73
また不調か
468名無しさん@お腹いっぱい。
2024/06/29(土) 14:49:22.21
10分前から
「Sorry
Cannot start capture」
10分ぐらい前までなんてことなかったのに突然
469名無しさん@お腹いっぱい。
2024/06/29(土) 15:21:10.49
自作のスクリプトはこんなこと言ってたな。
API が返した JSON の一部の値を印字しているだけだが、メモリオーバーか?

いま再度試したらアーカイブに成功、復活したか。
470名無しさん@お腹いっぱい。
2024/06/30(日) 11:39:49.24
ダメだこりゃ
https://archive.is/ey7zy
onion版も試してみたが同じ画面になった
471名無しさん@お腹いっぱい。
2024/06/30(日) 12:29:36.36
まだ
Sorry
Cannot start capture
のままだな
472名無しさん@お腹いっぱい。
2024/06/30(日) 13:12:10.15
俺もSorry Cannot start capture
473名無しさん@お腹いっぱい。
2024/06/30(日) 16:54:17.08
復旧した…か?
474名無しさん@お腹いっぱい。
2024/06/30(日) 17:37:13.93
直ったっぽい
475名無しさん@お腹いっぱい。
2024/07/02(火) 06:27:54.45
インスタは保存できなくなった?
476名無しさん@お腹いっぱい。
2024/07/02(火) 06:50:38.13
取得に失敗したurlもデイリーリミット300にカウントされるようになってて草
40台しか取れてねえ笑
477名無しさん@お腹いっぱい。
2024/07/02(火) 11:10:06.06
Internet Archive総合 (web.archive.org) #5 YouTube動画>3本 ->画像>69枚
478名無しさん@お腹いっぱい。
2024/07/02(火) 13:27:30.92
>>477
画面をキャプチャしたところで "Cannot start capture" 以外は何も判らないから
JSON 拾って来いよ
479名無しさん@お腹いっぱい。
2024/07/03(水) 03:23:28.45
リンク集は自分で持ってないと困る&
冗長的に野に放たれてないと価値がない&
リンク先消されたらあまり意味がない

インターネット暗黒時代近づいてるというかもう既に始まってるのかもしれんな
アーカイブも1個や2個じゃ足りないだろ
国は頼りねえし明日はどっちだ
480名無しさん@お腹いっぱい。
2024/07/03(水) 12:09:48.80
始まってるな
右から左にコピペしたかのようなキュレーションブログの乱立と
誤情報や嘘、政治的活動で溢れるSNSの台頭
481名無しさん@お腹いっぱい。
2024/07/03(水) 18:32:50.24
既存のブログやショッピングサイトなどをコピーしたものにマルウェアを仕込んでいる外国ccTLDのサイトとかもだな
そんなのが検索サイトで検索結果上位に出てくる始末
482名無しさん@お腹いっぱい。
2024/07/05(金) 10:20:12.61
今必死にフォレストページの好きなサイトアーカイブしてるけど、一日200回の制限がキツいわ...
483名無しさん@お腹いっぱい。
2024/07/05(金) 11:18:21.68
>>482
200回って縛りプレイ?大変だね
こっちは既に322回、一日40000回の制限なんて到達したこと無いw
484名無しさん@お腹いっぱい。
2024/07/05(金) 21:39:10.33
スプシでアウトリンク有りにして1000個くらいアーカイブすればあっという間に5万件の制限かかるぞ
485名無しさん@お腹いっぱい。
2024/07/05(金) 21:45:39.28
typoした4万件だわごめん
https://i.ibb.co/z5r50gD/20240705214230.webp
486名無しさん@お腹いっぱい。
2024/07/05(金) 23:58:42.35
アカウント作れよ
487名無しさん@お腹いっぱい。
2024/07/05(金) 23:59:31.26
>>484
アウトリンクってjsとか画像とかしょっちゅう取り逃がすからあんまり使えないよな
488名無しさん@お腹いっぱい。
2024/07/06(土) 05:12:31.93
ページの数が多かったらだるいけどそうじゃないなら適当な拡張機能でページ内のリンク全部取得すればいいだけだから使いようによってはかも
アカウントにあまりあったから482のやつ手伝おうかと思って試したんだけど、検索結果にでてくるHPがおくれて描画されるせいでアウトリンクにかからないのがしんどくてやめた
数千ページもちまちまURL取得するわけにもいかんし
こういうときにささっとスクリピングのスクリプト書いてURL取得するスキルが有ればずっと楽なんだろうけどね(泣)
489名無しさん@お腹いっぱい。
2024/07/06(土) 17:09:45.88
今って一日4万件だけなのかもっと多くなかったっけ
490名無しさん@お腹いっぱい。
2024/07/07(日) 22:44:32.87
>>489
Save Page Now 2 Public API の User Status 応答の変遷(日本時間午前9時過ぎ)
2023/02/18(土) {"available":6,"daily_captures":0,"daily_captures_limit":100000,"processing":0} この日から記録を始めた
2023/08/21(月) {"available":6,"daily_captures":0,"daily_captures_limit":80000,"processing":0}
2023/09/06(水) {"available":6,"daily_captures":0,"daily_captures_limit":70000,"processing":0}
2023/09/29(金) {"available":8,"daily_captures":0,"daily_captures_limit":70000,"processing":0}
2023/11/23(木) {"available":8,"daily_captures":0,"daily_captures_limit":50000,"processing":0}
2023/12/12(火) {"available":7,"daily_captures":0,"daily_captures_limit":30000,"processing":0}
2023/12/17(日) {"available":8,"daily_captures":0,"daily_captures_limit":50000,"processing":0}
2024/02/24(土) {"available":7,"daily_captures":0,"daily_captures_limit":40000,"processing":0}
2024/02/29(木) {"available":7,"daily_captures":0,"daily_captures_limit":30000,"processing":0}
2024/03/14(木) {"available":7,"daily_captures":0,"daily_captures_limit":40000,"processing":0}
491名無しさん@お腹いっぱい。
2024/07/07(日) 23:01:26.63
503出てる
492名無しさん@お腹いっぱい。
2024/07/08(月) 01:28:10.83
メンテか
493名無しさん@お腹いっぱい。
2024/07/08(月) 05:31:22.66
メンテ終了したようだ
494名無しさん@お腹いっぱい。
2024/07/08(月) 11:32:24.08
イモグラはどうでも良いグロ画像をキャプチャしたら取れた。
肝心なヤツはいつも取れない
495名無しさん@お腹いっぱい。
2024/07/09(火) 12:17:06.83
どうなってんだこれ
Internet Archive総合 (web.archive.org) #5 YouTube動画>3本 ->画像>69枚
496あぼーん
NGNG
あぼーん
497名無しさん@お腹いっぱい。
2024/07/09(火) 16:18:52.82
ネットサービス板にスクリプト荒らし登場、か。
498あぼーん
NGNG
あぼーん
499名無しさん@お腹いっぱい。
2024/07/09(火) 19:15:27.15
5ch取ったらitestに飛ばされるようになったのか
500名無しさん@お腹いっぱい。
2024/07/10(水) 00:58:57.63
またつながらない
501名無しさん@お腹いっぱい。
2024/07/10(水) 01:35:04.90
つながった
2日前ほど時間がかからずに済んだ
502名無しさん@お腹いっぱい。
2024/07/10(水) 08:03:41.68
数時間前にアーカイブを表示しようとURLを検索したら503エラー。今も直らない
503名無しさん@お腹いっぱい。
2024/07/15(月) 19:53:32.26
wayback-gsheets のキューが進まない。。。
504名無しさん@お腹いっぱい。
2024/07/17(水) 18:56:41.27
866 billionから更新されんな
505名無しさん@お腹いっぱい。
2024/07/18(木) 21:31:39.79
Vector がホームページサービスを終了だとよ。ダウンロードサービスは継続。
https://www.itmedia.co.jp/news/articles/2407/18/news117.html
506名無しさん@お腹いっぱい。
2024/07/19(金) 02:49:14.00
hpの方に詳しい情報を載せてる作者もままいるから損失もそれなりの規模だなぁ
なんもかんもなくなる日本
507名無しさん@お腹いっぱい。
2024/07/19(金) 08:43:01.22
まるで日本以外ではなんもかんも残ってるかのようだ
508名無しさん@お腹いっぱい。
2024/07/19(金) 14:01:49.76
あら?503になって繋がらない…
onion版も一昨日から繋がらないしどうしたんだろ…
509名無しさん@お腹いっぱい。
2024/07/19(金) 17:12:03.45
いま復活してるけどちゃんと取れるか心配だ
510名無しさん@お腹いっぱい。
2024/07/19(金) 17:36:17.10
取れないよ
511名無しさん@お腹いっぱい。
2024/07/20(土) 14:59:01.95
ふむふむ
512名無しさん@お腹いっぱい。
2024/07/21(日) 15:23:45.67
除外URLって異議申し立て出来ないの?
noteとかメルアドが漏洩した当時はログを消すのは理由があったけど
今でも出来ないのはビジネスの都合なだけじゃん
513名無しさん@お腹いっぱい。
2024/07/22(月) 00:05:43.81
>>512
著作権があるから無理、ただでさえIAはギリギリの所に居るのにやる意味ない
グレーゾーンを超えたらどうなるかは例の出版社からの訴訟を見れば分かる
514名無しさん@お腹いっぱい。
2024/07/22(月) 14:02:01.82
まぁどうしても保存したきゃ手間がかかって七面倒な上に証拠能力としての価値はスクショ同然になる問題点はあるがmht保存機能やらを使ってページをローカル保存して足が付きにくいように無関係な適当なファイル名やらに変更した上で難解なパスワード入れて圧縮したzipやら7zやらを適当なロダに上げて直リンをwebarchiveや20MB以内ならウェブ魚拓に保存すると言う奥の手も無くもない。
515名無しさん@お腹いっぱい。
2024/07/22(月) 15:53:24.11
重いからか知らんけどCollections情報見えないな
516名無しさん@お腹いっぱい。
2024/07/25(木) 20:09:51.21
1週間近く接続終わってるな
517名無しさん@お腹いっぱい。
2024/07/29(月) 07:20:04.82
xを保存したいんですけど、archive.orgは方法ありますか?
archive.phはいけるんですけど…
518名無しさん@お腹いっぱい。
2024/07/29(月) 08:30:28.47
今はarchive.phへ取ったTweetのURL( archive.ph/〜 )で、再びorgへ取れるようになってるんじゃない?
519名無しさん@お腹いっぱい。
2024/07/29(月) 08:31:05.15
・・・今春辺りまで1年以上、ph内のアーカイブ済みページはorgへ再取り出来ない不便が続いてたみたいだけどさ。
520名無しさん@お腹いっぱい。
2024/07/30(火) 14:02:34.70
ページ取得ミスする頻度が最近高すぎる・・・
そのくせに再取得まで時間空けなきゃいけないから面倒
521名無しさん@お腹いっぱい。
2024/07/30(火) 19:25:54.71
寄付少なくて維持が大変なのかな
522名無しさん@お腹いっぱい。
2024/07/30(火) 19:45:59.34
画像が取れないうえに何度やっても失敗する
523名無しさん@お腹いっぱい。
2024/08/01(木) 01:14:56.77
Archive制限が多いな、結局mdへ取るしかなかったり。
524名無しさん@お腹いっぱい。
2024/08/01(木) 14:20:28.07
https://www.itmedia.co.jp/news/articles/2408/01/news124.html
カカクコムは8月1日、アニメやゲームなど“アキバ系”のカルチャーを紹介する情報サイト「アキバ総研」を9月30日に終了すると発表した。
 2002年8月の開設から22年の歴史に幕を閉じる。
終了後、記事やレビュー、投票など各種コンテンツはすべて閲覧できなくなる。
https://akiba-souken.com/article/66874/
525名無しさん@お腹いっぱい。
2024/08/01(木) 20:28:10.53
ページングが生きてるけど、最古のが2012-01-13。それより前の記事は一覧取れないのかな
https://akiba-souken.com/article/?page=2566
https://akiba-souken.com/article/14614/

タグ検索すると2010-05-21のも取れるから、どこかでインデックス切れてるのかな
https://akiba-souken.com/article/search/tag/?tag=%E5%BA%97%E8%88%97&page=69
https://akiba-souken.com/article/9017/

番号全部漁るしか無いのかな
526名無しさん@お腹いっぱい。
2024/08/01(木) 21:21:55.59
22年も続いたのかあ・・・
527名無しさん@お腹いっぱい。
2024/08/02(金) 12:49:22.59
>>525
元々アキバ総研の使ってた古いドメインは( http://akiba.kakaku.com/ )。

しかし最古のTopアーカイブが2007年なんで、もっと前はさらに別かな?





《 アキバ(秋葉原)の最新情報がわかる!アキバ総研

http://web.archive.org/web/20070112154118/http://akiba.kakaku.com/   》
 
528名無しさん@お腹いっぱい。
2024/08/02(金) 18:12:57.73
https://akiba-souken.com/article/250/
これが最古かな?
529名無しさん@お腹いっぱい。
2024/08/02(金) 19:06:34.60
2002 年 8 月 26 日開設、その 3 日後のキャプチャ。
https://web.archive.org/web/20020829160703/kakaku.com/akiba/
530名無しさん@お腹いっぱい。
2024/08/02(金) 19:37:59.44
比較的単純だから取りやすそう
531名無しさん@お腹いっぱい。
2024/08/02(金) 22:58:13.55
>>529
J-Sky H" Palm PDA Lモード って時代を感じるな…
532名無しさん@お腹いっぱい。
2024/08/03(土) 00:12:56.02
YouTubeで消えた動画見ようとしてもCookieの認証が云々って出てそこから進めないんやが
Cookieはどうやって対策するのか、誰か教えてくれると助かる
533名無しさん@お腹いっぱい。
2024/08/03(土) 02:08:46.06
再生画面すら保存しきれていない動画で
動画本体までアーカイブされているもんかねぇ
534名無しさん@お腹いっぱい。
2024/08/03(土) 09:23:37.85
 
【  ■5ちゃんねる■過去ログ・過去ログ倉庫■運用情報・不具合報告■
http://2chb.net/r/operate/1697962402/


93 名前:[sage] 投稿日:2024/03/07(木) 13:54 ID:

http://2chb.net/r/kankon/1369777130/
だめだ みれない




97 名前:[sage] 投稿日:2024/03/08(金) 14:12:29.76 ID:zwv+kDuO0

>> 93
http://mimizun.com/log/2ch/kankon/1369777130/




120 名前:[] 投稿日:2024/04/02(火) 13:04:41.44 ID:

ジムが何年前のインタビューで匿名掲示板バブルは過去の話しだと語っていたから今の5chでは現状維持が精一杯で過去ログ復旧にまで回せる資金はないだろね




153 名前:[sage] 投稿日:2024/05/01(水) 15:59:47.12 ID:

みみずん検索で我慢だな   】
 
535名無しさん@お腹いっぱい。
2024/08/03(土) 15:46:23.33
最近サ終したサイトってでんファミwiki以外になにかある?
536名無しさん@お腹いっぱい。
2024/08/04(日) 08:04:52.78
トップにリダイレクトされるのって仕様?
https://web.archive.org/web/20240803200528/https://akiba-souken.com/vote/v_1111/
537名無しさん@お腹いっぱい。
2024/08/04(日) 09:06:33.03
>>536
view-source:https://web.archive.org/web/20240803200528id_/akiba-souken.com/vote/v_1111/
144 行目にホスト名が akiba-souken.com かどうかのチェックが入ってる。
538名無しさん@お腹いっぱい。
2024/08/04(日) 09:40:43.69
>>537
つまりリダイレクトされちゃうからアーカイブとってもweb.archive.org上では閲覧できない?
539名無しさん@お腹いっぱい。
2024/08/04(日) 11:46:30.88
>>538
ページ内画像が低質化してしまったり省略されてしまう場合があるけど文章メインで読めりゃいいならCano-Lab等、PC2m系の携帯端末変換スクリプトを通すなり…。

強制リダイレクトを弾ける(無力化)ブラウザがあれば素で開けるだろうけど




      ―――
http://www.cano-lab.org/pc2m/pc2m.php?_ucb_c=300&_ucb_v=2&_ucb_u=https://web.archive.org/web/20240803200528/https://akiba-souken.com/vote/v_1111/

http://www.cano-lab.org/pc2m/pc2m.php?_ucb_c=300&_ucb_v=2&_ucb_u=https://akiba-souken.com/vote/v_1111/
 
540名無しさん@お腹いっぱい。
2024/08/04(日) 14:31:11.06
CloudFlareの認証画面を使うサイトも増えてきたなぁ
Cookie送れば突破出来るんかな、めんどい・・・
541名無しさん@お腹いっぱい。
2024/08/04(日) 16:25:09.20
>>539
uBoでweb.archive.org##+js(aopr, String.fromCharCode)のルール追加して対処しました!
542537
2024/08/04(日) 19:12:55.52
>>537
いま見直したら行番号が違うな・・・
広告ブロッカーの手が入ったキャッシュを見てたのかも、まあいいや。

>>541
location.host みたいな、オリジンサイトとアーカイブとで値が変わるプロパティの参照を
検出させた方が良いように思えます。
543名無しさん@お腹いっぱい。
2024/08/04(日) 19:20:57.89
>>540
DLsiteやDMMの18歳以上バナーをすり抜ける手段とかもな。

強制リダイレクトはYahoo!内のページでも発生することがあったり
544名無しさん@お腹いっぱい。
2024/08/05(月) 06:48:22.40
archive.today死んでるね
545名無しさん@お腹いっぱい。
2024/08/05(月) 13:28:21.41
>>536
disable javascriptすれば見れるけど…
546名無しさん@お腹いっぱい。
2024/08/06(火) 13:21:50.81
ドメイン毎の統計情報見れるようになったって事かこれ?
https://web.archive.org/details/tld:com
https://web.archive.org/details/tld:jp
547名無しさん@お腹いっぱい。
2024/08/07(水) 00:23:01.34
なんとかサイト一覧をアーカイブしたいサイトメモ
2024/09/30 閉鎖 アキバ総研 >>524-527
2024/12/20 閉鎖 vectorの作者個人ページ >>505
548名無しさん@お腹いっぱい。
2024/08/07(水) 00:56:45.51
vectorもったいないよなぁ
549名無しさん@お腹いっぱい。
2024/08/07(水) 03:42:51.14
archive.todayが一部の回線やブラウザを使うとアクセスできないかwelcome to nginxになる状態なんだけどこれどういう状態なんだ…
550名無しさん@お腹いっぱい。
2024/08/07(水) 03:59:53.62
>>549
回線は関係ないやブラウザの問題だわ
551名無しさん@お腹いっぱい。
2024/08/07(水) 06:13:56.55
>>549
welcome to nginxになった時は
archive.todayのCookieを削除すると直る
.zipとか取得しようとするとそうなる
552名無しさん@お腹いっぱい。
2024/08/07(水) 06:33:54.20
>>549
archive.today は、Cloudflare DNS Resolver の利用を拒否しているのでDNSの設定を自分でいじったのなら他に戻す
553名無しさん@お腹いっぱい。
2024/08/07(水) 07:06:51.47
>>551,552
ありがとうクッキー消したら一旦は普通にアクセス出来るようになったわ
ちょくちょくタイムアウトするのはまた別の問題かしら
あと特定のサイトの画像を保存しようとするとまたwelcom to nginx状態になった
554名無しさん@お腹いっぱい。
2024/08/07(水) 12:59:00.50
http://kakaku.com/book_cd_dvd/ 7/31
https://engawa.kakaku.com/ 10/31
555名無しさん@お腹いっぱい。
2024/08/07(水) 14:10:30.49
>>549
> archive.todayが一部の回線やブラウザを
>


取得済みアーカイブを開く時にブラウザUAが Internet ExplorerだとTopへ飛ばされるんで他へ設定変えなきゃならなくなってる。
 
556あぼーん
NGNG
あぼーん
557あぼーん
NGNG
あぼーん
558あぼーん
NGNG
あぼーん
559あぼーん
NGNG
あぼーん
560あぼーん
NGNG
あぼーん
561あぼーん
NGNG
あぼーん
562あぼーん
NGNG
あぼーん
563あぼーん
NGNG
あぼーん
564あぼーん
NGNG
あぼーん
565あぼーん
NGNG
あぼーん
566あぼーん
NGNG
あぼーん
567名無しさん@お腹いっぱい。
2024/08/09(金) 13:11:43.85
ついにここにもスクリプトが来たのか
568あぼーん
NGNG
あぼーん
569あぼーん
NGNG
あぼーん
570名無しさん@お腹いっぱい。
2024/08/12(月) 00:29:31.19
IAで、久しぶりにとある人のアカウントを見に行ったら
Uploadsの欄にThis patron has not uploaded any items yet.ってなってるって事は
全部消したか、消されたかってことなんかな?

他のタブを見るとReviewsには1件レビューの履歴があったけど、それだけだった
571名無しさん@お腹いっぱい。
2024/08/13(火) 11:22:16.10
なんじゃこりゃ
https://web.archive.org/web/0im_/https://files.catbox.moe/wcihet.png
572名無しさん@お腹いっぱい。
2024/08/14(水) 22:49:41.90
このReportボタンって機能してるの?
押しても反応ないんだけど
Internet Archive総合 (web.archive.org) #5 YouTube動画>3本 ->画像>69枚
573名無しさん@お腹いっぱい。
2024/08/15(木) 16:30:47.49
いまは一分間に 8 件までアーカイブできるのね。
574名無しさん@お腹いっぱい。
2024/08/15(木) 22:00:30.42
鯖落ちてる?
575名無しさん@お腹いっぱい。
2024/08/16(金) 23:25:40.50
つながらなくなった
576名無しさん@お腹いっぱい。
2024/08/16(金) 23:34:34.14
つながった
そこまで長引かなかったのがまだ増しか
577名無しさん@お腹いっぱい。
2024/08/17(土) 13:43:40.01
今日は全然取れないな
578名無しさん@お腹いっぱい。
2024/08/18(日) 01:07:28.04
ここしばらくちゃんと取得したページが表示できるようになるまで1週間以上かかることがザラ
579名無しさん@お腹いっぱい。
2024/08/19(月) 09:27:51.14
Job failed
580名無しさん@お腹いっぱい。
2024/08/19(月) 18:19:27.05
ミルダムは無理だよな・・・
581名無しさん@お腹いっぱい。
2024/08/20(火) 08:19:14.94
ミルダムって今見てきたけど、アーカイブは元々ほとんど残らないのかな?
何人か見たけど、アーカイブ 動画が0件の人ばっかり。
一人だけ2週間分のアーカイブが残ってる人が居たけど、そんな訳ないし
582名無しさん@お腹いっぱい。
2024/08/20(火) 08:23:05.22
2024/09/01 閉鎖 ミルダム https://support.mildom.com/hc/ja/articles/36550955435161
2024/09/30 閉鎖 アキバ総研 >>524-527
2024/12/20 閉鎖 vectorの作者個人ページ >>505

しかも閉鎖がほぼ10日後?急すぎるし・・・
583名無しさん@お腹いっぱい。
2024/08/20(火) 09:40:35.76
ミルダムって初めて聞いたw
運営企業とか辿っていくと、単にチャイナリスクが発現しただけにしか見えんな
584名無しさん@お腹いっぱい。
2024/08/20(火) 19:02:09.02
ミルダム懐かしすぎる
まだあったのか

>>581
作成したアーカイブの保存期間
15日間保存※された後、期間中に一定数視聴がない場合削除されます。
※公式番組や他企業さまとの協賛案件など、運営が必要と判断したアーカイブは除きます。

https://support.mildom.com/hc/ja/articles/360057548353-%E3%82%A2%E3%83%BC%E3%82%AB%E3%82%A4%E3%83%96%E3%81%AE%E4%BF%9D%E5%AD%98-%E3%83%80%E3%82%A6%E3%83%B3%E3%83%AD%E3%83%BC%E3%83%89%E3%81%AB%E3%81%A4%E3%81%84%E3%81%A6
585名無しさん@お腹いっぱい。
2024/08/20(火) 19:26:58.55
サーバー落ちてるな
586名無しさん@お腹いっぱい。
2024/08/20(火) 21:26:40.09
復帰して個々のアーカイブは表示できるようになったけど
アーカイブ一覧を表示させようとするとエラーが返る
587名無しさん@お腹いっぱい。
2024/08/21(水) 21:10:42.95
複数窓すると制限かかるのな
588名無しさん@お腹いっぱい。
2024/08/23(金) 09:27:55.59
オリエント工業が廃業とのこと。
https://web.archive.org/web/20240822083754/www.orient-doll.com/newsSingle/?no=436
昨晩よりテキトーに巡回してアーカイブをとってみたけど、取りこぼしがあるかも。

年齢認証が入ってるので、個別の画像などを除きそのままでのアーカイブは不可。
Web ブラウザで認証を通した後のクッキーを capture_cookie に喰わせれば行ける。
30 分くらいの無通信でセッションが切れるので、その場合は再認証の必要あり。
589名無しさん@お腹いっぱい。
2024/08/25(日) 23:26:02.78
連日Job failedばかり
590名無しさん@お腹いっぱい。
2024/08/26(月) 03:42:53.42
重くて使い物にならない
ゴミでしかない
591名無しさん@お腹いっぱい。
2024/08/26(月) 12:31:29.65
Save outlinksにチェックを入れてsave pageするとJob failedになるくさい?
表向きはログが残らないどこぞの生まれたばかりの掲示板のスレを元画像ごと保存しようとしたら上記のエラーになった…
Save outlinksが導入された当初は垢無しでも出来たのにどんだけ鯖への負担になってるのよこの項目
592名無しさん@お腹いっぱい。
2024/08/26(月) 15:09:43.56
>>591
outlinksに関係なくJob failedになるよ
最近は不安定
593名無しさん@お腹いっぱい。
2024/08/26(月) 15:23:59.23
Job failed と unreachable は数分おきに同じリクエストを繰り返したら
だいたい 3 回か 5 回くらいでアーカイブ成功するね
594名無しさん@お腹いっぱい。
2024/08/29(木) 21:16:20.87
wayback-gsheetsはまあまあ問題なさそう
Internet Archive総合 (web.archive.org) #5 YouTube動画>3本 ->画像>69枚
595名無しさん@お腹いっぱい。
2024/08/30(金) 01:17:12.09
アキバ総研について色々調べたんでシェア

2002/08/29 頃にサイトがオープンして、当時のURLはこれ
http://kakaku.com/akiba/
当時の記事URLはこんな感じ。
http://kakaku.com/akiba/hayamimi/06/12/hayamimi20061229_Opteron290.htm
http://kakaku.com/akiba/hobby/06/12/hobby_20061229hobby_newcos.htm

2007年頃からサブドメインになった。
http://akiba.kakaku.com/
http://akiba.kakaku.com/hobby/0701/11/185503.php
http://akiba.kakaku.com/pc/0701/12/204420.php

ここまでの記事は、今は多分全部アクセス出来ない?

akiba-souken.com は2011/09/13 にオープンしたけど、当時はアニメの感想がメインだったっぽい
2012/09/13からニュース記事が配信されるようになって、この頃から記事のURLは以下の形式になった。
https://akiba-souken.com/article/67324/

当時はサイトリニューアル!ってプレスリリースも出していたみたい。
https://corporate.kakaku.com/press/release/20110913
https://corporate.kakaku.com/press/release/20120913

kakakucom配下の記事はもうアクセス出来ないから
今クロールを頑張るなら https://akiba-souken.com/article/[0-70000]/ って感じになるのかな
596名無しさん@お腹いっぱい。
2024/08/30(金) 01:39:48.50
>>595
すげーな
こういうのどうやって調べるんだ?
自分のアーカイブする時の参考にしたい
597名無しさん@お腹いっぱい。
2024/08/30(金) 01:54:10.40
>>596
過去のURLは>>529,527 に書いてあって
後はその中で最古の記事はどれか、最後の記事は何かをチマチマ調べただけ。
"2011年" "アキバ総研" でググったり。

あと、↓のapiでarchiveされてるURLの一覧がドメイン指定で一気に取得出来るから、それをローカルでDBに突っ込んでURL一覧を眺めながら過去どんなサービスがあったのか調べた。
http://web.archive.org/cdx/search/cdx?url=akiba-souken.com&output=json&limit=10&filter=statuscode:200

APIの仕様は以下のページ。
https://github.com/internetarchive/wayback/tree/master/wayback-cdx-server

limitパラメーターを外すと全件出力されるから、curlとかでローカルにファイルとして保存して、それを色々解析するのがいいと思う。
598名無しさん@お腹いっぱい。
2024/08/31(土) 07:23:56.54
>>597
APIあったんだな知らなかった
ありがとう
599名無しさん@お腹いっぱい。
2024/09/01(日) 23:23:01.42
連日重たい・・潜在的なバグでもあるんかな
600名無しさん@お腹いっぱい。
2024/09/02(月) 21:40:47.23
 
大昔の5ch過去ログも無料では復活しないかもしれぬから、みみずん鯖で保管されてる分だけでも一括アーカイブされればいいけど…。






《  携帯5chブラウザ ぬこ Part181
http://2chb.net/r/chakumelo/1721834468/


186 名前:携帯電話情報通知[] 投稿日:2024/09/01(日) 22:38 ID:

久しぶりに過去ログ見ようと思ったら、5chサーバ混雑またはサーバ落ちのため、レスを取得できませんでした。しばらく待ってリロードしてください。ってずっと出てくるんだけどもう見れないの?





192 名前:携帯電話情報通知[sage] 投稿日:2024/09/02(月) 06:41 ID:

>> 186
大昔の分はヌコの過去ログ検索でも板の綴りとスレッド数字列まで判明するから mimizunサービスにバックアップされてれば見れる。まあ実況系板はかなり補完漏れ生じてるようだが



〈 WOWOW 17
http://mimizun.com/log/2ch/weekly/1058205020/  〉   》
 
601名無しさん@お腹いっぱい。
2024/09/03(火) 09:12:04.60
いつの間にか2chの過去ログ見れるところが無くなってるんだよな
5ch公式はシステム作り直してます乞うご期待!とか年単位で言ってるし
他の過去ログサイトは全部潰れたし
こういう時にこそscの出番だろ と思って初めてアクセスしたけど、嫌儲みたいな人が多い板はともかくマイナーな板は繋がりもしなかったから全然駄目だ

http://2chb.net/r/operate/1697962402/
602名無しさん@お腹いっぱい。
2024/09/03(火) 20:56:15.45
>>524
ニュース WEBメディア「アキバ総研」が9月30日でサービス終了へ、惜しむ声続々
WEBメディア「アキバ総研」が2024年9月30日(月)15時をもってサービスを終了することを発表した。
「アキバ総研」ではアニメの最新ニュースのほか、各クール毎に放送されるアニメ一覧の公開やレビュー機能、投票企画や秋葉原の地元ネタなどの掲載で親しまれている。
「アキバ総研」サービス終了のお知らせ
「アキバ総研は、『アニメ&アキバ系カルチャー情報』を発信するメディアとして2002年からコンテンツ提供を続けてまいりましたが、この度、2024年9月30日(月)をもちましてサービスを終了することとなりました、
サービス終了に伴い、記事及びレビュー、投票などはすべて閲覧できなくなります。
改めまして、アキバ総研は2024年9月30日(月)をもちましてサービスを終了いたします、これまでご利用いただき、誠にありがとうございました。」
突然の終了発表を受け、SNSには「サービス終了は正直言って残念です。」・「サービス終了だなんてさみしい。」・「サービス終了と聞いて衝撃を受けた。」・「また一つの時代が終わる。」・「アキバ総研までなくなっちゃうなんて。」と、惜しむ声が続々と上がっている。
603名無しさん@お腹いっぱい。
2024/09/04(水) 13:44:39.02
もうこれ半分インターネット考古学だろ
604名無しさん@お腹いっぱい。
2024/09/04(水) 20:09:53.72
サ終する時、サ主がIAにデータ提供してから閉めればこっちは保存しなくて済むから楽なんだけどな
605名無しさん@お腹いっぱい。
2024/09/04(水) 22:14:35.35
公式にそれをしにくいのはまあ分かるけど
せめてURLの一覧をどっかに置いておいてくれたらこっちで登録するんだけどな
例えばアキバ総研の記事は /article/66874/ の数字の部分を上げていけばいいけど
1記事で2ページ目があったり、記事の中に画像があったりするとそっちのURLも登録しないといけない。
606名無しさん@お腹いっぱい。
2024/09/08(日) 20:42:52.19
TVerプラス【サービス終了のお知らせ】
https://plus.tver.jp/

平素より「TVerプラス」をご利用いただき、誠にありがとうございます。
2024年9月30日をもちまして「TVerプラス」はサービスを終了させて
いただくこととなりました。
長らくのご愛顧、誠にありがとうございました。
607名無しさん@お腹いっぱい。
2024/09/09(月) 06:43:27.03
ねとらじもいつの間にか終わってた発表から数日で終わりは悲しいな
608名無しさん@お腹いっぱい。
2024/09/09(月) 07:48:35.37
5ちゃんの過去ログ見れないのは辛い
609名無しさん@お腹いっぱい。
2024/09/09(月) 15:07:39.03
大昔のはmimizunで開け。
610名無しさん@お腹いっぱい。
2024/09/09(月) 17:44:19.03
mimizunってまだ生きてたんだな…

試してみたけど、datは取れない感じなのかな
https://mimizun.com/blog/2012/02/post-694.html

http:// mimizun .c om/log/2ch/newsplus/1268106381/ はhtmlで見れるけど

$ curl -i -A "xxx Monazilla/1.00 xxx" "http:// mimizun. c om/log/2ch/newsplus/1268106381.dat"
を指定してもhtmlが返ってくる。

2024年にTwitterで御本人に質問している人が居るけど反応無いっぽい
x[.]com/1010Kui/status/1748324729457639583
611名無しさん@お腹いっぱい。
2024/09/09(月) 17:45:33.71
from:mimizun 過去ログ とか dat で検索すると過去ログを調べるのに有用な情報が盛り沢山だな
612名無しさん@お腹いっぱい。
2024/09/09(月) 18:26:29.62
みみずんのデータもいずれ手動登録しなきゃダメなのか
613名無しさん@お腹いっぱい。
2024/09/10(火) 02:47:28.52
twitterとるには結局どうすりゃ良いんだ
todayしかないか
614名無しさん@お腹いっぱい。
2024/09/10(火) 13:47:09.33
 
《  http://yomoyama-bbs.jp/test/read.cgi/2/2817/


3 名前:名無し[sage] 投稿日:2024-09-10 13:21 ID:


Twitter運営はUI改悪しまくりやがって会話ログも検索結果群もアーカイブ不良きたすに堕した。

ミラークライアントのMovatterとか、Nitter鯖の復活増を願うしかない  》

 
615名無しさん@お腹いっぱい。
2024/09/10(火) 16:43:42.05
pythonでテキストファイル読み取って
SPNにURL送るようなスクリプト作ったんだが
送る感覚ってどれくらいがいいんだろう
1分に1URLとか?
流石にもっと早くしても鯖負担かからないだろうか
616名無しさん@お腹いっぱい。
2024/09/10(火) 18:02:46.03
>>615
一年くらい前は立て続けにアクセスすると TCP セッション自体がブロックされたりしてたけど
今は一秒間隔でも多分大丈夫。
とは言っても一分あたりの受け付けリスエスト数の上限があるから
随時 user status を読み取って、上限を超えてたら暫く (※) 待つような仕組みを入れないと
まともに動かないよ。

(※)
上の「一分あたりのリスエスト数」を管理しているカウンタは毎分 00 秒にリセットされる。
マシンの NTP 同期の精度にもよるけど、余裕を見て時計が次の 01 秒とか 05 秒とかになるまで
待たせておけば充分。
617名無しさん@お腹いっぱい。
2024/09/10(火) 18:09:39.06
それとは別に、同一サーバの長大ファイル群を連続してアーカイブさせる場合などは
向こうの並行ダウンロードセッション数があまり大きくならないように
こちらで抑えてあげないと、途中でちょん切れたものがアーカイブされてしまうのは
困った話。
618名無しさん@お腹いっぱい。
2024/09/10(火) 20:35:08.79
アーカイブ職人
619名無しさん@お腹いっぱい。
2024/09/11(水) 03:49:37.13
>>613
間接的でいいならnitter経由でとったら
まだ動いてるインスタンスあるし
620名無しさん@お腹いっぱい。
2024/09/11(水) 06:32:54.48
既にほんの僅かだから復活鯖が増えぬと死んだ時点でオワコンへ…。
 
621名無しさん@お腹いっぱい。
2024/09/12(木) 09:36:19.45
Google検索でキャッシュ復活へ Internet Archiveとの提携で
https://www.itmedia.co.jp/news/articles/2409/12/news085.html
622名無しさん@お腹いっぱい。
2024/09/12(木) 10:03:37.77
>>621
URL貼ったついでにアーカイブしておくとか、そういうのは頭に無いんだw
623名無しさん@お腹いっぱい。
2024/09/12(木) 12:32:19.46
>>622
なんだコイツ?
嫌味マウント取りマン
624名無しさん@お腹いっぱい。
2024/09/12(木) 14:56:31.65
ググルキャッシュは無くなると言われてたけれどリンクが無くなっただけで今もずっと機能してたしこれがIAに変わるなら今まで知らなかった人たちの削除申請が始まりそうです
625名無しさん@お腹いっぱい。
2024/09/12(木) 15:03:00.33
消されたページは検索結果に出ないからキャッシュまで来れないだろうし大丈夫じゃね
その辺調べてIAまで辿り着ける人はもともと削除依頼してるだろうし
626名無しさん@お腹いっぱい。
2024/09/12(木) 16:14:42.67
グーグルキャッシュだと数時間前のキャッシュということも多々あったけど
Internet Archive だと数年前のキャッシュということもありそうだ
627名無しさん@お腹いっぱい。
2024/09/12(木) 18:24:45.00
試してみたが、そもそもキャッシュ自体が分かりづらい場所にあるなw
知らない人は見つけられなそう、まぁそっちの方がいいか
628名無しさん@お腹いっぱい。
2024/09/12(木) 20:43:20.91
従来のキャッシュが廃止だと「テキストのみ表示」の機能も喪失となって不便出そう。
629名無しさん@お腹いっぱい。
2024/09/12(木) 21:12:40.09
グーグルがキャッシュを保持しなくなったら検索すら機能しなくなるだろ
それがアクセスしやすい場所で公開されるかどうかとは別の話
630名無しさん@お腹いっぱい。
2024/09/14(土) 02:50:08.13
archivetodayというゴミサイト開けないが
631名無しさん@お腹いっぱい。
2024/09/14(土) 16:19:12.35
初歩的なこと聞いていい?
クレカで寄付の時に入れる名前って支援者一覧みたいに公開されたりしないよな?
632名無しさん@お腹いっぱい。
2024/09/15(日) 20:28:32.09
>>631
基本的にこういうサイトで寄付者を公開するときは本人の同意が必要なはず
633名無しさん@お腹いっぱい。
2024/09/15(日) 21:18:10.02
>>632
ありがとう
大丈夫だろと思いつつ不安だったんで助かった
634名無しさん@お腹いっぱい。
2024/09/16(月) 01:02:59.80
何でそんなに謙虚なんだよ
635名無しさん@お腹いっぱい。
2024/09/16(月) 12:37:44.51
実名掲載されるのが嫌
同姓同名なんて腐るほどいるだろうけど気分的に
636名無しさん@お腹いっぱい。
2024/09/16(月) 15:34:54.67
Wayback Machineで呼び出せな…、つまり死んでる
気になる記事があるときに限って
637名無しさん@お腹いっぱい。
2024/09/18(水) 02:24:57.28
アーカイブ画面上部の時系列バーが復活。
うちの環境では消えてたんだよね、おま環なら広告ブロッカー辺りの設定を見直すわ。
638名無しさん@お腹いっぱい。
2024/09/18(水) 06:24:15.07
>>637
同じく
上のバー消えてて昨日今日辺りからまた前みたいに出るようになった
639名無しさん@お腹いっぱい。
2024/09/18(水) 08:54:29.23
>>638
そうか良かった
寄付しろメッセージなどは出るたびにブロックさせてたから、何かの拍子に巻き添えにしたかもと思ってたんだ。
640名無しさん@お腹いっぱい。
2024/09/19(木) 06:56:34.66
archive.today数日前はキューが1万件以上あって保存まで数時間かかる惨状だったが復調してきたね
リキャプチャ要求される間隔はかなり短くなった
641名無しさん@お腹いっぱい。
2024/09/19(木) 19:05:30.37
>>624
> ググルキャッシュは無くなると言われてたけれどリンクが無くなっただけで今もずっと機能してたしこれがIAに変わるなら今まで知らなかった人たちの削除申請が始まりそうです
>




↑今日で旧来のGoogleキャッシュが完全に終わっちまったみたいだ…。

不便増えるわ。
 
642名無しさん@お腹いっぱい。
2024/09/20(金) 20:34:33.75
503か
643名無しさん@お腹いっぱい。
2024/09/22(日) 07:48:48.69
X(旧Twitter)のポスト(ツイート)が取得できない
強制的にZachXBT/status/1425569468755890180?mx=2に飛ばされる
644名無しさん@お腹いっぱい。
2024/09/22(日) 07:49:36.70
ちなみにarchivetodayだと取得可能
645名無しさん@お腹いっぱい。
2024/09/22(日) 16:17:54.58
いつも重いなと思ってたら平日の昼間なら軽くて夜が重かったんだな
646名無しさん@お腹いっぱい。
2024/09/23(月) 18:45:31.13
https://nitter.lucabased.xyz/

↑現状このサイト経由ならTwitter(X)保存できるで。ドイツのサイトらしいが
647名無しさん@お腹いっぱい。
2024/09/24(火) 01:28:52.61
Twitter運営にBANされるからもう晒さんでほしかった。
648名無しさん@お腹いっぱい。
2024/09/24(火) 12:31:51.82
nitterはもう・・・
649名無しさん@お腹いっぱい。
2024/09/25(水) 18:26:45.93
todayでインスタ取れるようになったな
650名無しさん@お腹いっぱい。
2024/09/25(水) 23:57:41.84
意外とIAって知られてないよね
まあ知られたら知られたで色々規制厳しくなって
アーカイブ消えまくるんだろうけど

アーカイブを増やそうと有名にすればするほど
騒がれてアーカイブが消えていくジレンマ
651名無しさん@お腹いっぱい。
2024/09/26(木) 05:18:36.77
 
【  【ネット】ついにGoogle検索のキャッシュ提供が完全終了
http://2chb.net/r/scienceplus/1727269320/


    ――

ついにGoogle検索のキャッシュ提供が完全終了
http://2chb.net/r/newsplus/1727231285/


116 名前:名無し[] 投稿日:2024/09/26(木) 05:12 ID:


各大学レポジトリの歴史論文とかPDFだから、HTMLへ変換されたGoogleキャッシュが便利だったのに…。   】

 
652名無しさん@お腹いっぱい。
2024/09/26(木) 10:46:57.84
>>601
大昔のスレ参照(共有)するのにスレタイとアドレスは最低持ってないと大変 それでも外部のまとめがヒットするとは限らんし

scは太古のログを持ってない 結構深刻な問題 archiveに入れたかどうかで命運分かれてしまってる

sc発足以降のクロールはまばらだが時々チェックしておくと参考になる 5chのドメイン部分を雑に2ch。scと打ち替えてもリダイレクトされる
実況などのスレ落ち早い板のクロールは苦手だが専門板はわりとまともに動作 メモ用にも使える

5ch新設板とpink系はクロールしない(2chではないため ただ一部例外あるっぽい)

スレ立てスクリプトの被害は5chよりも2chのほうが多大なのでメモスレなどを形成した場合は注意
またクロールしたスレをスレタイ検索で探すのは困難(対応している適当な検索があまりない)なので必要なものは控えをとる
653名無しさん@お腹いっぱい。
2024/09/26(木) 12:53:16.70
>>547
魔法のiランド 2025/03/31にカクヨムに統合
https://maho.jp/info/entry/maho_i_will_no_longer_available
手動でエクスポートインポートする機能が提供されてるけど全ユーザー自動ではないから消える作品も沢山有るんだろうな
コンテンツ本文はjavascriptで書いてるからアーカイヴするには工夫が必要そう
軽く見ただけで2007年とかの作品あるから、消えるのは惜しすぎる…なんとかしたい
654名無しさん@お腹いっぱい。
2024/09/26(木) 13:03:21.46
IA上で適当ながら作品のURLを入れてみたら、ページの保存はされてるけど本文は読めない状態だった。

本文は動的にgraphQLから取得してる。
スクレイピンク時にURLをシャープ込みで正しく指定して、javascriptが実行されれば保存出来そうだがどうかな…
655定期
2024/09/26(木) 15:11:36.96
 
【  600 名前:名無しさん[sage] 投稿日:2024/09/02(月) 21:40

大昔の5ch過去ログも無料では復活せぬかもしれんから、みみずん鯖で保管されてる分だけでも一括アーカイブされればいいけど…。






《  携帯5chブラウザ ぬこ Part181
http://2chb.net/r/chakumelo/1721834468/


186 名前:携帯電話情報通知[] 投稿日:2024/09/01(日) 22:38 ID:

久しぶりに過去ログ見ようと思ったら、5chサーバ混雑またはサーバ落ちのため、レスを取得できませんでした。しばらく待ってリロードしてください。ってずっと出てくるんだけどもう見れないの?





192 名前:携帯電話情報通知[sage] 投稿日:2024/09/02(月) 06:41 ID:

>> 186
大昔の分はヌコの過去ログ検索で板サーバ名の綴りとスレッド数字列まで判明するから mimizunサービスにバックアップされてれば見れる。まあ実況系板はかなり補完漏れ生じてるようだが



〈 WOWOW 17
http://mimizun.com/log/2ch/weekly/1058205020/  〉  》  】
 
656名無しさん@お腹いっぱい。
2024/09/26(木) 15:29:10.14
>>650
明らかにデジタル焚書だよね
657名無しさん@お腹いっぱい。
2024/09/26(木) 15:32:05.42
ついにGoogle検索のキャッシュ提供が完全終了 [おっさん友の会★]
http://2chb.net/r/newsplus/1727231285/
658名無しさん@お腹いっぱい。
2024/09/26(木) 17:17:30.38
せめてスレッドのホスト名、スレッドキー、タイトルの一覧くらいはどこかで確保したいんだよなあ
659名無しさん@お腹いっぱい。
2024/09/26(木) 18:16:07.28
去年あたりの規制前に5chのアーカイブしとけば良かったなぁ・・・
まさかこんな事になるとは思わなかった
660名無しさん@お腹いっぱい。
2024/09/27(金) 00:14:10.81
去年に頑張って5chの過去ログを過去サーバー含めてスレタイ一覧スクレイピングしたよな…githubの自分のレポジトリにスクレイピング用のソース残ってるし
と思ったらその後CドライブのSSDが吹っ飛んだからその時に一緒に消えたんだった…

なんJがスレッド数がめちゃくちゃ多くてページ数がすごい事になってた記憶
661名無しさん@お腹いっぱい。
2024/09/27(金) 11:05:15.95
国家事業での保護も民間での保護も法整備も必要
だが当面何一つ進みそうにない我が国

海外勢がやみくもに取得して利益独占しそう(IAも一応これ) 原本がないものの権利の主張は難しいし
662名無しさん@お腹いっぱい。
2024/09/27(金) 21:57:26.30
↓だってさ。
「状況どう?」って聞いたその日にこの書き込みがあったから、まさか「今日ぶっ壊れた」って事は無いだろう。
「アーカイブを展開するところからやり直している」とは一言も書いてないのが気になるんだよなあ…
"アーカイブの展開"は手間がかかってまだ着手してない。つまり本当にアーカイブの中にデータが揃っているかも現状不明で
下手するとアーカイブ出来てませんでした も全然あるよなあ…

■5ちゃんねる■過去ログ・過去ログ倉庫■運用情報・不具合報告■
http://2chb.net/r/operate/1697962402/357

357 名前:Ace ★[] 投稿日:2024/09/27(金) 14:50:10.24 ID:CAP_USER
残念なお知らせです。

過去ログ鯖は着々と作業をしていた模様ですが、物理的にぶっ壊れたそうです。
アーカイブ等はバックアップしているのでネットの彼方に消えたわけでは無いですが、
アーカイブを展開するところまで「振り出しに戻る」という状況です。

363 名前:Ace ★[] 投稿日:2024/09/27(金) 16:39:08.02 ID:CAP_USER
>>362
バックアップはアーカイブ状態なので展開しないと見れません
663名無しさん@お腹いっぱい。
2024/09/28(土) 07:06:26.44
ここの運営の言う事なんかまともに信用できないんだから全部ぶっ壊れてる前提でいなきゃだめ
664名無しさん@お腹いっぱい。
2024/09/28(土) 14:22:54.82
mimizum(みみずん)のログを archive.org へ保全するほうが先決じゃないの?

あすこも何時まで鯖の維持出来るか分からぬだろうし( 既にログ速も Unker も亡くなった… )
 
665名無しさん@お腹いっぱい。
2024/09/28(土) 15:22:11.90
自分だけかもしれないけどアキバ総研のアーカイブした記事を見ようとするとトップに飛ばされる
(魚拓とtodayのは普通に見れる)
666名無しさん@お腹いっぱい。
2024/09/28(土) 15:28:22.03
>>665
>>537 に書いてあるとおりjsでチェックしてる。
正直いやらしいけどIA対策としては有効ではあるんだよな…
667名無しさん@お腹いっぱい。
2024/09/28(土) 15:29:25.95
>>664
みみずんって
・datの取得はできなくなっている
・htmlは取得出来る
・ただし、htmlの一覧が無いから総当りするしかない?

と思ってるんだけどどうよ
特にページの一覧が無いとどうしようもない
668名無しさん@お腹いっぱい。
2024/09/28(土) 15:32:07.82
強制リダイレクトを無効化するブラウザ無かった?

記事文だけならテキストブラウザなり読む方法は色々あるが
669名無しさん@お腹いっぱい。
2024/09/28(土) 15:40:04.04
>>667 
かころぐjp の検索結果か、Archive.org 内の各板・過去鯖スレッド一覧アーカイブから末尾キー拾わせてくしかないかもしれない…。



〈  かころぐ kakolog.jp
http://2chb.net/r/esite/1725790523/  〉
 
670名無しさん@お腹いっぱい。
2024/09/28(土) 15:41:45.03
>>668
アキバ総研はjsを無効化してもページ内容読めるから、devtoolから無効化すればchromeでも見れる。

それ以外だと、インターネットアーカイブのリンクをクリックするだけで見れる!とはならないけど
iframeのsandbox属性でjavascript無効にすると見れる。
671名無しさん@お腹いっぱい。
2024/09/28(土) 15:43:07.34
>>669
とにかくまずはスレッドの一覧を作る所が一番大切だよな…
個人的にはbbspinkも救出したいんだけど、
とにかくサーバー名・板ID(esite)・スレッドキー(1690465133) の3属性があれば特定は出来るか
672名無しさん@お腹いっぱい。
2024/09/28(土) 16:33:30.28
URL貼ってもアーカイブが出てこないで直接今のURLが開かれるだけになっているのだが?
673名無しさん@お腹いっぱい。
2024/09/28(土) 21:49:59.89
アキバ総研もうアカンわ…
どこか引き取れやー!
674名無しさん@お腹いっぱい。
2024/09/29(日) 09:27:10.05
>>610
みみずんはhttpsだと開けないからhttpを指定しないといけなくて面倒
675名無しさん@お腹いっぱい。
2024/09/29(日) 09:32:54.82
>>661
紙媒体なら国立国会図書館がとりあえず大体保存してくれるからいいんだけどね…
WARPは官公庁あたりしか残してくれないから
676名無しさん@お腹いっぱい。
2024/09/29(日) 09:41:01.97
こういうサービスの終了を見るたびにXanaduが実現していればと思う
ハイパーリンク同士を参照し合う原理上リンク切れが起こらないからアーカイブももっと楽になるはず
677名無しさん@お腹いっぱい。
2024/09/29(日) 11:41:07.72
>>673
記事が全部InternetArchiveに記録されてるから、一覧表示サイトを作ったで。twitterで検索よろしく
678名無しさん@お腹いっぱい。
2024/09/29(日) 16:01:41.40
すげえぇeeeーー!
あなたが神か
679名無しさん@お腹いっぱい。
2024/09/30(月) 01:15:43.18
アキバ総研は今日の15時に閉鎖
各々思い残しがないように
680名無しさん@お腹いっぱい。
2024/09/30(月) 10:55:59.71
インターネット上に放たれた情報は
2度と制御できない不滅って認識だったが
・検索できなくなって埋もれる
・サービス終了して消される
・作者が消す

ほとんどの情報はこの3つのどれかに行き着くのかもしれないな
681名無しさん@お腹いっぱい。
2024/09/30(月) 15:11:20.27
アキバ総研オワタ「\(^o^)/」
682名無しさん@お腹いっぱい。
2024/10/01(火) 20:25:24.28
TVerプラスの保全お願いに来たかったんだけど
間に合わなかった…😭
683名無しさん@お腹いっぱい。
2024/10/02(水) 09:53:22.70
zakzakが閉鎖するらしい
ああいうニュースサイトって過去の記事けしまくってるから積極的なアーカイブする必然性は薄いと思ってるんだけどどう?
全記事一覧ページって無いよね?
684名無しさん@お腹いっぱい。
2024/10/07(月) 18:42:17.86
hxh.rakuwiki.com にあるコンテンツ(特に画像)を保存したいと考えています
http://hxh.rakuwiki.com/card/2436/
スクショ(青矢印) Internet Archive総合 (web.archive.org) #5 YouTube動画>3本 ->画像>69枚

書き込みがエラーでうまくいかないので、内容のスクショとテキストをpastebinに記載しました

内容のスクショ Internet Archive総合 (web.archive.org) #5 YouTube動画>3本 ->画像>69枚
pastebin https://paste.gg/p/anonymous/263a8a6e1ddd41c1b43815887822235b/files/e0cf8a0acaca40db990260d2a507e002/raw

なにかよい方法が有りましたらぜひ教えて下さい
685名無しさん@お腹いっぱい。
2024/10/07(月) 19:24:54.46
>>684
なんかそこ、HTTP HEAD を無条件に排除してない?
force_get=1 を付けて個々のファイルをアーカイブする分には問題無さそうなんだけど。
686名無しさん@お腹いっぱい。
2024/10/07(月) 19:31:20.82
・・・と思ったら、無しでも行けることがあるな。
404 を返す条件がよく解らん。
687名無しさん@お腹いっぱい。
2024/10/08(火) 01:48:36.49
>>680
AI使ってるせいなのか検索結果がばらばらで本当に困る
688名無しさん@お腹いっぱい。
2024/10/08(火) 22:45:16.52
20時くらいからずっと↓の画像みたいな感じ
https://archive.is/uddYw/8db426acab07bc6238b207583d8bca29ecc49c16.webp
689名無しさん@お腹いっぱい。
2024/10/10(木) 06:56:10.18
503になってやんの
https://archive.is/Eq9jL/c5122a9ba29600342d6d4a5a301ca2486bf80f39.webp
690名無しさん@お腹いっぱい。
2024/10/10(木) 07:46:07.35
サイト改竄?により情報漏洩を示唆する謎メッセージが出現
Internet Archive総合 (web.archive.org) #5 YouTube動画>3本 ->画像>69枚



セキュリティ大手情報サイト Bleeping Computer によると
3,100万人分のユーザデータの流出していて、本物であることも確認済みとのこと

流出したデータ
・メアド
・表示名
・パスワード変更時間
・Bcryptでハッシュ化されたパスワード など

Internet Archive hacked, data breach impacts 31 million users
https://www.bleepingcomputer.com/news/security/internet-archive-hacked-data-breach-impacts-31-million-users/
691名無しさん@お腹いっぱい。
2024/10/10(木) 07:48:20.47
情報漏洩との関連性は不明だが、BlackMetaを名乗るハカーがDDoS攻撃仕掛けてるらしい
692名無しさん@お腹いっぱい。
2024/10/10(木) 08:16:30.69
【時系列】
9日前:
何者かが流出データを情報流出確認サイト"Have I Been Pwned"の管理人に共有

3日前:
管理人は内容を精査しInternet Archiveに通知するも音沙汰なし

今朝:
サイト改竄 & 報道でお祭り騒ぎ


IT系ニュースサイトも続々と報道し始めてる
大変なことになったな
https://www.theverge.com/2024/10/9/24266419/internet-archive-ddos-attack-pop-up-message
https://www.pcmag.com/news/hacker-defaces-internet-archive-claims-it-suffered-a-breach
693名無しさん@お腹いっぱい。
2024/10/10(木) 11:34:54.15
「Wayback Machine」のInternet Archiveから3100万人のユーザーデータ漏えい
694名無しさん@お腹いっぱい。
2024/10/10(木) 12:22:15.66
つまらん
過去全データとバックアップ削除して復旧不可能にならんと祭りじゃないよ
695名無しさん@お腹いっぱい。
2024/10/10(木) 12:35:35.47
IA設立者Brewster Kahle氏、情報流出・サプリチェーン攻撃によるサイト改竄・DDoS攻撃があったと発表
https://twitter.com/brewster_kahle/status/1844183111514603812
https://twitter.com/thejimwatkins
696名無しさん@お腹いっぱい。
2024/10/10(木) 18:51:47.73
酷い連中だわ
697名無しさん@お腹いっぱい。
2024/10/10(木) 19:04:34.53
ライブラリの方は元々メタデータからメールアドレスが取り出せる仕組みだったし、
パスワードだけでなくメアドも他所のアカウントとは分離したりとか
対策できる人はやってたでしょ
698名無しさん@お腹いっぱい。
2024/10/10(木) 20:37:26.16
今繋がらないのは落とされてるのか・・・
699名無しさん@お腹いっぱい。
2024/10/10(木) 21:03:26.71
昼間は普通に繋がったんだけどね
700名無しさん@お腹いっぱい。
2024/10/10(木) 21:52:21.02
何か繋がらないなと思ったら、ハッキングされてたのか・・・
701名無しさん@お腹いっぱい。
2024/10/10(木) 22:14:34.77
今日つながらないなぁと思ってここに来たらハックの情報を知って
慌ててIAのログインに使ってたメアドのパスを変えてきた
702名無しさん@お腹いっぱい。
2024/10/10(木) 23:53:48.70
>>699
2・3日前からつながったりつながらなかったり
703名無しさん@お腹いっぱい。
2024/10/11(金) 03:12:43.70
知識不足でよくわからないんだが、Wayback Machineのユーザー情報漏洩って、
Wayback Machineにユーザー情報とかあったの?
URL貼って日付け選んで、削除前のHPに行くくらいしか使ったことないんだが・・・
削除前のHPでログインした情報とかが漏洩したって事?
704名無しさん@お腹いっぱい。
2024/10/11(金) 03:32:56.45
ハッキングされたって事はウイルス仕込まれた可能性もあるのか・・・?
705名無しさん@お腹いっぱい。
2024/10/11(金) 03:37:09.23
ちょくちょく利用してたけど、ここがなくなったら困るんだが、復活するかな?
706名無しさん@お腹いっぱい。
2024/10/11(金) 04:19:13.11
誰がどんなサイトを保存したのか、バレるのか
707名無しさん@お腹いっぱい。
2024/10/11(金) 08:20:01.87
>>153-154
Googleのcacheコマンドは先月から廃止された
https://internet.watch.impress.co.jp/docs/yajiuma/1626367.html
708名無しさん@お腹いっぱい。
2024/10/11(金) 08:23:17.67
>>703
Internet Archiveにはメールアドレスを登録することで
デジタル化された本を借りることができる機能がある
709名無しさん@お腹いっぱい。
2024/10/11(金) 08:48:55.53
>>707
既に>>651のリンク先で出ていたな
710名無しさん@お腹いっぱい。
2024/10/11(金) 13:08:29.13
503 エラーページに Bluesky と Mastodon へのリンクを追加。
711名無しさん@お腹いっぱい。
2024/10/11(金) 13:25:27.26
各リンク先
Twitter/X
https://twitter.com/internetarchive/
Bluesky
https://bsky.app/profile/did:plc:73dpznbu4wqwtcyurwbiulov
Mastodon
https://mastodon.archive.org/deck/@internetarchive

うんこ
https://twitter.com/thejimwatkins
712名無しさん@お腹いっぱい。
2024/10/11(金) 20:45:02.49
DDoS攻撃してる奴が飽きるか対策するかだけど改竄までされてるからもう無理かなあ・・・
713名無しさん@お腹いっぱい。
2024/10/11(金) 21:22:57.85
アーカイブのデータは壊されていないとのこと
https://x.com/brewster_kahle/status/1844485102312751421

サイトを改竄してお漏らしさせる事案って本当に多いんだよね
一週間前のタリーズオンラインストアもそれでしょう
それともアーカイブ自体の破壊が目的だったのか
714名無しさん@お腹いっぱい。
2024/10/11(金) 21:47:04.10
壊されたらハッカーも困りそう
715名無しさん@お腹いっぱい。
2024/10/11(金) 22:00:12.22
ミソがついた形だが、アーカイブが改ざんされていないかどうかの信用評価はこれから
716名無しさん@お腹いっぱい。
2024/10/11(金) 23:51:36.34
 
Internet Archive の場合、今までは非SSL端末や非SSLブラウザでも自由にPageアーカイブ保存したり開いたり出来たのが利点だったけど、今回の鯖ダウンを契機としてセキュリティ引き上げを口実に非SSLの締め出し強行されたら嫌だなぁ…。






《  【悲報】新浪人のUPLIFT、httpsがTLS1.0→TLS1.2になった為に一部の専ブラでログインできない事が判明 [487816701]

http://2chb.net/r/news/1693635036/?v=pc   》

 
717名無しさん@お腹いっぱい。
2024/10/12(土) 12:43:56.83
archiveの代替サイトまとめて
718名無しさん@お腹いっぱい。
2024/10/12(土) 13:05:54.64
なんだこの改行野郎
頭悪そう
719440
2024/10/12(土) 17:46:40.53
https://x.com/brewster_kahle/status/1844790609573277792
>Estimated Timeline: days, not weeks.

マダァ?(・∀・)っ/🍵⌒✨
復帰してくれないとarchive.orgを使う次のレスが打てん

5chでリンク張ると横に文字数が長くなるキライがあるけど、
こういう時にリンクにアドレス名が入ってると
元のアドレスが何か判るのは良い(archive.todayだと何のリンクか判らなくなる)

ユーザー登録ログイン機能って必要性あったのかな?

それと、
Twitter(𝕏), Instagram, Facebookなど(5chのレスも鯖によって執れない処があった記憶)
執れないと判明してるサイトを無駄に執らせる仕様も改良してほしい
archive.todayの方では執れたりするから
技術的に🉑能と想われるのでなんとかしてほしい
720名無しさん@お腹いっぱい。
2024/10/12(土) 20:19:08.42
Archive.today は
https://archive.is/https://example.com/
でもリンクできる(ただしアーカイブの一覧になる)
721名無しさん@お腹いっぱい。
2024/10/12(土) 20:19:09.63
Archive.today は
https://archive.is/https://example.com/
でもリンクできる(ただしアーカイブの一覧になる)
722名無しさん@お腹いっぱい。
2024/10/12(土) 21:30:06.09
webページのキャプチャだけならログインは不要かもしれんけど
ファイルのアップロード機能もあるからな
まあweb割れの総本山のイメージしか無いけど。
723名無しさん@お腹いっぱい。
2024/10/12(土) 21:44:27.67
archive.todayのアーカイヴされたページの「シェア」を押すと長いリンクを見られる

https://archive.today/2024.10.12-122059/https://www.isitdownrightnow.com/web.archive.org.html

日時は下記のようにもできる
https://archive.today/20241012122059/https://www.isitdownrightnow.com/web.archive.org.html
724名無しさん@お腹いっぱい。
2024/10/12(土) 22:28:32.21
専ブラでは問題無かったりするけど
URL の真ん中にスキーム名が残るのは避けたいことがあるのよね
まぁ : を %3a に置換すれば良いのだけど
725名無しさん@お腹いっぱい。
2024/10/12(土) 22:58:38.09
have i been pwnedで調べたら見事にメルアドとパスワード抜かれてたわ
普段使ってるメルアドじゃなかったからまだマシかも
726名無しさん@お腹いっぱい。
2024/10/12(土) 23:25:23.43
個々のスクリプト毎にランダム生成の捨てアドでアカウントを作ってたけど
取り敢えずパスワードは変えるかぁ・・・
727名無しさん@お腹いっぱい。
2024/10/13(日) 00:09:51.53
流出したパスワードは平文じゃなくてハッシュだけどな
まぁ不安なら変えといた方がいい
728名無しさん@お腹いっぱい。
2024/10/13(日) 00:17:40.71
ようずんにこすたことはないね
729名無しさん@お腹いっぱい。
2024/10/13(日) 02:09:18.44
しかしまぁいつ頃復旧すんだろうね?
どっかの国産動画サイトよろしく2ヶ月弱とか勘弁願いたいが
730名無しさん@お腹いっぱい。
2024/10/13(日) 02:51:36.76
これで閉鎖したらアキバ総研の呪いという事にする
731名無しさん@お腹いっぱい。
2024/10/13(日) 04:56:01.20
>>729
ブリュースター・ケール曰く"days, not weeks"
その言葉を信じれば今週中じゃないかな
732名無しさん@お腹いっぱい。
2024/10/13(日) 21:21:29.69
目的がわからん
大企業狙えよ
733名無しさん@お腹いっぱい。
2024/10/13(日) 21:38:02.33
新興宗教も
734名無しさん@お腹いっぱい。
2024/10/13(日) 22:52:09.85
これアーカイブするか→IA開く→そういや落ちてたわ・・・
ってのを繰り返してる
735名無しさん@お腹いっぱい。
2024/10/14(月) 13:06:39.78
とりあえずは閲覧限定だが仮復旧したか
全面復旧はいつになるのやら
736名無しさん@お腹いっぱい。
2024/10/14(月) 18:08:14.91
見られるようになったね
とりあえずデータは破壊されていなかったようで一安心
737名無しさん@お腹いっぱい。
2024/10/14(月) 21:28:28.88
アキバ総研アーカイブも無事動いてよかった。
セキュリテイ強化と言い出して仕様変わったら見れなくなってた
738名無しさん@お腹いっぱい。
2024/10/14(月) 21:49:23.21
まだ新規に取れるわけではないのか
739名無しさん@お腹いっぱい。
2024/10/14(月) 22:04:12.53
サイト見ちゃって大丈夫かな?
なんか変なスクリプト埋め込まれてたら嫌なんだが
まあみるだけなら大丈夫か
740名無しさん@お腹いっぱい。
2024/10/14(月) 22:50:21.89
>>738
取得のページに一応アクセスはできるが、残念ながら・・・
741名無しさん@お腹いっぱい。
2024/10/14(月) 23:28:55.23
ウェブアーカイブは仮復旧、こちらは何時になるかな
https://archive.org/details/software
742名無しさん@お腹いっぱい。
2024/10/15(火) 01:49:18.57
正直こっちのほうがKADOKAWAへの攻撃よりも個人的には衝撃を受けたわ
743名無しさん@お腹いっぱい。
2024/10/15(火) 01:58:50.02
同じく
744名無しさん@お腹いっぱい。
2024/10/15(火) 02:25:44.94
テスト
745名無しさん@お腹いっぱい。
2024/10/15(火) 02:28:10.02
6/8にニコニコがハッキングされてさ
8/8ぐらいに復旧したんだけど
Switchで観るかスマホで観るしかなかった
それで最近になってWebCast使ってここの動画をまぁ…いろいろ観て楽しんでたわけよ
それで一通りそれらを見て落ち着いたあたりでこれだ
PS5も値上がりしてモンハン買う気起きなくなったし厄年すぎる
746名無しさん@お腹いっぱい。
2024/10/15(火) 02:29:55.41
WebCastでChromecastのキャスト伝ってiPhoneに変なもん送れるならやってみろって感じ
Google様とApple様に手を出すのが怖いチキン共だから
脆弱そうな角川やらここを狙うしかねえんだろ?
747名無しさん@お腹いっぱい。
2024/10/15(火) 02:31:51.68
そういやニコニコは復旧後コメントの過去ログが取れなくなった。
復旧予定項目にも無いし、無かったことになりそう
それか過去ログはデータが本当に消えちゃったか。
748名無しさん@お腹いっぱい。
2024/10/15(火) 02:47:47.24
ニコる履歴で俺のコメントだって紐付けされてたぞ
749名無しさん@お腹いっぱい。
2024/10/15(火) 04:30:02.59
無関係すぎて知らんがな・・・
750名無しさん@お腹いっぱい。
2024/10/15(火) 21:24:44.10
過去の英語の記事をたくさん見るから困ってます。代替え手段はありますか?
751名無しさん@お腹いっぱい。
2024/10/15(火) 22:31:47.67
これも時代の流れなのか
752名無しさん@お腹いっぱい。
2024/10/16(水) 00:53:05.19
504 Gateway Time-out
こればっか
753名無しさん@お腹いっぱい。
2024/10/16(水) 16:38:37.34
まだSPNは復旧してないか
754名無しさん@お腹いっぱい。
2024/10/16(水) 16:53:15.81
10日位にダウンしたからもう一週間位のアーカイブ全部吹っ飛んだか・・・悲しい
755名無しさん@お腹いっぱい。
2024/10/16(水) 17:52:41.01
毎日なんかアーカイブしてるの…?
756名無しさん@お腹いっぱい。
2024/10/16(水) 20:15:26.07
>>755
個人的には半日位でスレ落ちして原則ログが残らない某画像掲示板とかいつ消えるかもわからんSNSの元画像とかそんな所か
魚拓やarchive.isでいいじゃんって言われそうだが一件一件チマチマ登録すんのが面倒でタイパ悪いしwebarchiveに比べて色々制限があんのが…
757名無しさん@お腹いっぱい。
2024/10/16(水) 21:17:44.59
試しにCNNとか有名どころのurlで探してみると毎日アーカイブ取得されてるのが分かるな
古いアーカイブは探せるようにはなってるから
758名無しさん@お腹いっぱい。
2024/10/16(水) 22:09:13.71
>>756
魚拓は24時間に60件まで
archive.is(というかarchive.today)はPDFに対応していない
やはりInternet Archiveにはかなわない
759名無しさん@お腹いっぱい。
2024/10/16(水) 22:20:35.28
>>756
https://tsumanne.net/

なおなぜかexcluded
760名無しさん@お腹いっぱい。
2024/10/16(水) 22:38:06.08
waybackmachine閲覧できるようになったらしいけどアクセスして大丈夫かな?ハッカーになんか仕掛けられてたら怖いんだが
一応そこも確認したのかな?
誰か教えて
761名無しさん@お腹いっぱい。
2024/10/17(木) 00:14:32.00
>>760
もう永遠にアクセスしない方がいい
ハッカーがとてつもないバックドアで回転木馬を不正ログインさせたからな
お前みたいな初心者は全情報抜かれる
762名無しさん@お腹いっぱい。
2024/10/17(木) 02:02:56.51
真面目な話期待したんだけど
763名無しさん@お腹いっぱい。
2024/10/17(木) 05:02:11.07
三角木馬ならちょっとは笑えたのに
764名無しさん@お腹いっぱい。
2024/10/17(木) 05:52:01.46
IAが潰された事によって他のアーカイブサイトにIA勢が湧いてきて糞重くなってんの怠い
765名無しさん@お腹いっぱい。
2024/10/17(木) 05:58:45.99
パスを変えたいがログインのページどこ?
766名無しさん@お腹いっぱい。
2024/10/17(木) 07:14:39.88
アーカイブサイトって
・IA
・archive today
・web魚拓

ここら辺しか知らないんだが
他のサイトってあるか?
情報一覧とか載ってるサイトとかあるのかな?
767名無しさん@お腹いっぱい。
2024/10/17(木) 10:36:35.50
んで、結局今アクセスするのは安全なん?
768名無しさん@お腹いっぱい。
2024/10/17(木) 11:01:39.09
https://x.com/waybackmachine/status/1846656653799895283
The Wayback Machine @waybackmachine
午前5:57 ・ 2024年10月17日

Wanted to share an update from Team @waybackmachine

The archives are safe & the Wayback Machine is up in read-only mode.

We hope to turn on more web crawling within a day to make sure our web collections remain whole.

Next up: Save Page Now.

Thank you for the support!


チーム@waybackmachineからの最新情報をお伝えします。

アーカイブは無事でWayback Machineは読み取り専用モードで稼動しています。

1日以内にさらにウェブのクロールを開始し、ウェブ・コレクションが
完全な状態で維持されるようにしたいと考えています。

次は、Save Page Now です。

応援ありがとうございました!
769名無しさん@お腹いっぱい。
2024/10/17(木) 11:54:52.70
>>765
ログイン周りは全く動いてないね

パスワードどころか、メールアドレスごと早く替えたい
こういうサイトの捨てアドで作ったアカウントがあるから
アドレスさえ判っていれば誰でも乗っ取れちゃうw
https://www.txen.de/
770名無しさん@お腹いっぱい。
2024/10/17(木) 14:22:34.07
>>766
10年以上前、Waybackが任意に保存できるの知らなくて某ブログを保存するのに使ったサイトがあったけど
そのサイト自体が消えたw(サイト名すら忘れた)、せめて魚拓使っとけばよかった
771名無しさん@お腹いっぱい。
2024/10/17(木) 15:11:04.91
>>770
アーカイブサイトが死ぬと
もうどうにもならないよな

この3つが生命線かぁ…
772名無しさん@お腹いっぱい。
2024/10/17(木) 16:16:23.92
>>770
昔は類似サイトいくつかあったけど
残ったのはこの3つ
773名無しさん@お腹いっぱい。
2024/10/17(木) 16:54:36.40
IA以上に信頼できるアーカイブサイトって無いからなぁ
web魚拓は営利企業だから収益が悪化すれば消える可能性あるし
todayに至っては運営者がよく分からん
774名無しさん@お腹いっぱい。
2024/10/17(木) 17:08:30.30
SAVEがしたいです…安西先生…
775名無しさん@お腹いっぱい。
2024/10/17(木) 17:48:04.12
個人的に保存したいだけならossのアーカイブツールが最強だけど
不特定多数に公開、もしくはアーカイブを証明として使うなら選択肢は片手で数えられるくらいしか無いよな
776名無しさん@お腹いっぱい。
2024/10/17(木) 18:10:04.35
保存はスクショでとも思うが
博物館がないと厳しい
777名無しさん@お腹いっぱい。
2024/10/17(木) 23:24:19.49
>>770
EvernoteのWebクリッパーは外部へ公開出来ないんだっけ?
 
778名無しさん@お腹いっぱい。
2024/10/18(金) 00:08:53.76
IAってエロ動画保存は駄目なの?
779名無しさん@お腹いっぱい。
2024/10/18(金) 01:43:00.69
成人エロでしょ、これまたどうして

ナチュリスト系のサイトはドメインごと排除されてたりするな
見る側は児○として見てるからねぇ
780名無しさん@お腹いっぱい。
2024/10/18(金) 04:20:09.17
アクセスしたけど、アクセスしない方が良かった?
サイトにウイルス仕込まれてたら、サイトにアクセスしただけでアウト?
781名無しさん@お腹いっぱい。
2024/10/18(金) 04:29:58.03
そんなこといちいち気にするくらいなら使うなよ
782名無しさん@お腹いっぱい。
2024/10/18(金) 08:59:34.28
流石に復旧する前にチェックしてるはず
だから大丈夫じゃない?
てか今どき見ただけでウイルスかかるってあるんか?
783名無しさん@お腹いっぱい。
2024/10/18(金) 13:03:34.03
>>766
アーカイブサイトの一覧はこの辺が参考になりそう

・Wikipediaで使われているウェブアーカイブ一覧
https://en.wikipedia.org/wiki/Wikipedia:List_of_web_archives_on_Wikipedia

・ウェブアーカイブの取り組み一覧
https://en.wikipedia.org/wiki/List_of_Web_archiving_initiatives
784名無しさん@お腹いっぱい。
2024/10/18(金) 19:05:17.11
進展あった
785名無しさん@お腹いっぱい。
2024/10/18(金) 19:16:12.83
Wayback Machine, Archive-It and blog.archive.org resumed.
アカウント周りはまだか
786719, 450
2024/10/18(金) 19:29:03.57
>>723
なるほど、これならarchive.Todayもリンクを遣い別けられる

>>783
archive.Orgは真ん中の日付を省略して最後に執ったものを表示させることが出来るのは知ってたけど、

 ・/web/0/ =Oldest
 ・/web/2/ =Newest

は知らなかった!
 ⚠︎Newestの方は最後がミスキャプチャーになるとミスキャプチャーを返すので使えない
  e.g. 🆖https://web.archive.org/web/2/https://twitter.com/internetarchive/

archive.Orgの画像の直リンを使う事が多いのだけど
その場合の/web/**************if_/や/web/**************im_/のアドレスにも
 ・/web/0if_/
 ・/web/0im_/
でOldestが効く模様
  e.g. 🇬https://web.archive.org/web/0im_/http://www.google.com/google.jpg

>>724
それは5chのUIを構築してる無能の不手際
ミラーの2ch(sc)の方ではそういう文字列もちゃんとリンクとして表記される
引用で5chの書き込みを使う時はscの方のリンクを使う様にしてる
  e.g. 🔗https://toro.2ch.s%EF%BD%83/test/read.cgi/win/1642086530/352n
      ※scは名前欄のレス番がsc増加レス分だけズレる
https://twitter.com/thejimwatkins
787786
2024/10/18(金) 20:02:29.57
 ・/web/1/ ≠Oldest
  e.g. 🔂https://web.archive.org/web/1im_/http://www.google.com/google.jpg

微妙に指定アドレスとは違う最古のものが表示されるけど
何だろうね1のパラメータは
788名無しさん@お腹いっぱい。
2024/10/18(金) 20:39:19.71
Stanford Web Archive Portal
789名無しさん@お腹いっぱい。
2024/10/18(金) 22:50:23.33
レトロPCのカタログとか雑誌切り抜きとかマニュアルを見ようと思ったら…全滅。そのうち復活するのかな
790名無しさん@お腹いっぱい。
2024/10/19(土) 01:31:21.61
ニコニコもハッキングされてたけど
海外のサイトはセキュリティ万全のイメージあるけど
日本と大して変わらないのか
791名無しさん@お腹いっぱい。
2024/10/19(土) 13:32:33.09
海外のサイトって主語がデカすぎるな
そもそも基盤ネットワークまで侵入されたニコニコとは比べ物にならん
792名無しさん@お腹いっぱい。
2024/10/19(土) 14:46:56.83
今のOS豊富な機能のバグ潰しきれてなくて穴だらけだから、
そこ悪用するだけだし
パスクラ(懐)
793名無しさん@お腹いっぱい。
2024/10/19(土) 20:58:14.80
URL 中の日時数字列、現在の取り扱いはおそらくこう:
1. 14 桁に満たない場合、後ろを 9 で埋めて 14 桁にする
2. 月、日、時など、それぞれ有効範囲外の値を正規化する
(99 月 → 12 月、99 日 → 31 日、99 時 → 23 時、など)
3. 出来上がった日時数字列に最も近いタイムスタンプのアーカイブを提示する

例: web.archive.org/web/20100/... を指定した場合
2010 年 09 月 99 日 99 時 99 分 99 秒 → 2010 年 09 月 30 日 23 時 59 分 59 秒
この時刻に最も近いアーカイブが出てくるはず。
https://web.archive.org/web/20100/www.google.com/

1 が最古、って言うのは archive.org 上のどこかのドキュメントに書いてあったんだよね。
でもそれも 20 年近く前の記憶。
794名無しさん@お腹いっぱい。
2024/10/20(日) 01:02:16.77
SPNが出来なさ過ぎてそろそろ禁断症状が出そう
795名無しさん@お腹いっぱい。
2024/10/20(日) 03:49:52.83
それが肝心だしなぁ
アクセスそのもの(閲覧だけ)の復旧には4日ぐらいかかったが、取得機能の復旧は果たして
一応>>768で触れられてるが・・・
796名無しさん@お腹いっぱい。
2024/10/20(日) 11:56:44.81
先週から休みを取らずに対処してるってスタッフが言ってるし、近いうちに直ると信じたい
あとこれを機に色んなシステムをアップデートしてるから時間がかかってるらしい
797名無しさん@お腹いっぱい。
2024/10/20(日) 18:50:38.90
vectorのHPってurlが連番かと思ったら大昔は?そうじゃないページもあったんだな
https://hp.vector.co.jp/authors/tfuruka1/
https://hp.vector.co.jp/authors/yohko/

こっちは連番だからこっちからスクレイピングすれば補足出来るか…
https://www.vector.co.jp/vpack/browse/person/an001687.html
798名無しさん@お腹いっぱい。
2024/10/21(月) 09:03:03.74
vectorみたいなフリーのHPスペースってどうやってアーカイブすればいいんだろう?
トップページのURL一覧は機械的に作成出来るだろうけど、その中のサブページ? は地道にhtmlをパースするしか無い?
配置されてるhtmlの一覧が見れれば嬉しいけど、そんなのあるわけ無いし
799名無しさん@お腹いっぱい。
2024/10/21(月) 09:17:00.54
Internet Archive、盗まれたアクセストークンを悪用され再び被害

サポートメールのシステムに侵入して、そこから攻撃者がメールを送信してきたらしい
削除リクエストを含む80万件以上の問い合わせ情報が流出か

Internet Archive breached again through stolen access tokens
https://www.bleepingcomputer.com/news/security/internet-archive-breached-again-through-stolen-access-tokens/
800名無しさん@お腹いっぱい。
2024/10/21(月) 09:36:01.55
マジで復旧後にwaybackmachine使ったらやばい?ページ改ざんされてる可能性ない?
801名無しさん@お腹いっぱい。
2024/10/21(月) 11:46:01.93
>>799
もうこれ作り直さなきゃダメなやつでは
802名無しさん@お腹いっぱい。
2024/10/21(月) 11:57:47.31
>>800
使うだけでヤバイってブラウザのゼロデイでも想定してるって事?
まさかとは思うが、よく分からんけどアクセスするだけで感染しそう!っていう小学生リテラシーじゃないよな
803名無しさん@お腹いっぱい。
2024/10/21(月) 12:36:28.88
>>799
ヤバいな
今の状況ってなかなかに試練じゃないか?
804名無しさん@お腹いっぱい。
2024/10/21(月) 12:44:02.51
ゼロデイじゃなくても信頼出来るサイトのアーカイブが改竄されて怪しいサイトのリンクに書き換えられたりするのも充分にリスクだと思うけどね
サンドボックスを理解してる技術者ならともかく、一般人はサイトにアクセスするのと、
出て来るダイアログを何も考えずにok押して勝手にダウンロードされたexeを開く行為の区別なんか無いし
805名無しさん@お腹いっぱい。
2024/10/21(月) 14:09:55.42
アーカイブが改ざんされたって情報はどこにもないけどね
妄想を元に推論していくならアクセスするなとしか言えない、それが一番安全
ゼロクリックでPCを壊すマルウェアを仕込むのも「技術的には可能」なので
806名無しさん@お腹いっぱい。
2024/10/21(月) 14:49:51.48
アクセスするなというか復旧後にすでに使ってるんだけどね。 
もうちょい待てば良かったか
てかよく見たら新しくやられたというより9日にハッキングされた時にとられた奴を利用された感じみたいね
流石に復旧する時にサイトは念入りにチェックしてると思いたいが
807名無しさん@お腹いっぱい。
2024/10/22(火) 03:42:51.84
ログイン画面は復活、しかしまだ入れない
https://archive.org/account/login
808名無しさん@お腹いっぱい。
2024/10/22(火) 13:31:08.55
祝復活?ためらいがちに使ってみるか
809名無しさん@お腹いっぱい。
2024/10/22(火) 16:04:42.23
ためらいがちとか生ぬるいこと言わず、
金輪際使うのをやめるって方法もあるんだぜw
810名無しさん@お腹いっぱい。
2024/10/22(火) 16:27:54.31
多少怖いよね。ハッキングされました→復旧しました。→昨日のニュースみたいなことが起きましただからね
おれはもう使っちゃたけど閲覧目的なら一旦様子見もありかもな
811名無しさん@お腹いっぱい。
2024/10/22(火) 17:34:16.64
多少怖いって何だよ
ちょっと怖かったり絶大に怖かったり変化するのかよ
812名無しさん@お腹いっぱい。
2024/10/22(火) 21:25:43.85
取る方がメインで見る方は元サイト消えた時だから今のIAに用無いわ
813名無しさん@お腹いっぱい。
2024/10/23(水) 01:45:01.09
アレ?また見れなくなった?
これ書き込んでる現在、こっちの環境だとこのサイトにアクセスできませんって出るのだが…
814名無しさん@お腹いっぱい。
2024/10/23(水) 02:00:50.64
こっちもアクセスできない
また何かあったのか、それとも完全復活の兆しか・・・
815名無しさん@お腹いっぱい。
2024/10/23(水) 02:33:31.77
落ちたはりますなぁ
816名無しさん@お腹いっぱい。
2024/10/23(水) 02:40:25.85
またハッキングされたんかな?
だとしたらもう復旧後に使ってるから勘弁なんだが
Xみても情報ない
817名無しさん@お腹いっぱい。
2024/10/23(水) 05:24:59.73
無反応だった archive.org は 503 ページを出すようになった
Wayback Machine の記述は削除、実際 web.archive.org は反応無し
22 日のイベントが終わったのか当該記述も削除
818名無しさん@お腹いっぱい。
2024/10/23(水) 09:15:33.64
IAハッキングしたのってニコニコと同じやつ?
819名無しさん@お腹いっぱい。
2024/10/23(水) 09:52:57.05
いいえ
820名無しさん@お腹いっぱい。
2024/10/23(水) 11:34:18.89
なんたるちあ
821名無しさん@お腹いっぱい。
2024/10/23(水) 12:28:30.64
waybackmachine復旧しても使わないほうがよさげ?
こうなるのわかってたら復旧後にアクセスしなかったよ。
検索閲覧程度なら大丈夫かな?
822名無しさん@お腹いっぱい。
2024/10/23(水) 12:36:36.43
>>821
大丈夫なわけ無いだろ
もう過去は振り返るな、真っ暗な将来だけを見て生きろ
823名無しさん@お腹いっぱい。
2024/10/23(水) 13:03:41.06
てかあれから進展あったの?
お知らせらしきもの探しても見つからんしハッキングされたときみたいにニュースになってない
824名無しさん@お腹いっぱい。
2024/10/23(水) 14:06:34.85
公式Twitterに書いてあるでしょ
825名無しさん@お腹いっぱい。
2024/10/23(水) 19:06:47.70
https://web.archive.org/web/*/example.com/*
みたいな感じの一覧出力が動作してない
826名無しさん@お腹いっぱい。
2024/10/23(水) 21:46:53.57
一覧にアクセスしようとすると
Wayback Machine failed to return archive information.
827787
2024/10/23(水) 22:08:08.04
https://web.archive.org/
このページ、放置してると文が上下に浮動するのナニコレ?w

Orgは復旧しなさそうだしTodayの方を遣うかなァ
828名無しさん@お腹いっぱい。
2024/10/23(水) 22:54:03.62
感染したんだろ
あーあ
829827
2024/10/23(水) 23:17:14.72
>>828
あほが無理してレスせんでええんやで?w
830名無しさん@お腹いっぱい。
2024/10/23(水) 23:39:01.00
あーこわいこわいw
831名無しさん@お腹いっぱい。
2024/10/23(水) 23:41:35.83
早くSPNを摂取させてくれ、体が震えてきた
832名無しさん@お腹いっぱい。
2024/10/24(木) 09:54:19.06
2024はサイバー犯罪元年だな
全世界で両手指を切り落とす刑罰の制定が必要だわ
833名無しさん@お腹いっぱい。
2024/10/24(木) 09:59:17.90
元年ではねぇだろwターニングポイントかすら怪しい
834名無しさん@お腹いっぱい。
2024/10/24(木) 10:19:46.01
archive.orgが生き返った模様
835名無しさん@お腹いっぱい。
2024/10/24(木) 11:04:56.13
だとしても様子見するわ。
836名無しさん@お腹いっぱい。
2024/10/24(木) 16:51:48.76
保存系のサイトまとめろよ
837名無しさん@お腹いっぱい。
2024/10/24(木) 19:57:10.68
503が出たので飛んできました
ハッキングの余波が収まらないのか
838名無しさん@お腹いっぱい。
2024/10/24(木) 23:16:33.43
ネットわかんないけどWayback Machine使ってるそこの君
常日頃IA使ってるだろうここへの書き込みがズレてるから知識をつけて半年ROMるといいぞ

まずはURIやHTMLやJavaScriptとDNSやGETリクエストの仕組みを入門とか初心者で調べて
スマホでもJavaScript(Kiwiの開発者モード)やPython(Termux)動かせるから手探りで色々やってみるんだ
https://chatgpt.com にバンバン疑問を投げかけるのも心がけろ
ばかにしたり煽る人もいるけど専門性が高いコミュニティは少なからずこれが当たり前だから気に病まず頑張れ
839名無しさん@お腹いっぱい。
2024/10/25(金) 00:35:26.24
復旧まだ?
840名無しさん@お腹いっぱい。
2024/10/25(金) 02:42:00.90
ずっと「Temporarily Offline」で取得不能
841名無しさん@お腹いっぱい。
2024/10/25(金) 16:27:16.90
使えるようになったら使いたいんだけど有名人のXじゃなくて一般人のXの削除ポストって見れる?
自分の1年前のポストなんだけどXのアーカイブだと消えてて。
842名無しさん@お腹いっぱい。
2024/10/25(金) 16:39:34.89
IAでアーカイブされていれば見れる
843名無しさん@お腹いっぱい。
2024/10/25(金) 16:58:47.12
それって事前に自分でやってなきゃだめってことです?
844名無しさん@お腹いっぱい。
2024/10/25(金) 17:08:00.65
>>842
>>841自身がIAアーカイブしてなきゃ可能性はかなり低いと思う
IAがXを自動収集している訳ではないし、人気のポストなら誰かがIAアーカイブしてくれてたかもだけど
Googleのキャッシュが現役だったらまだそちらの方が可能性があっただろうけど
845名無しさん@お腹いっぱい。
2024/10/25(金) 17:13:29.08
>>844
ですよね。となると見る方法はなさそうか
ありがとうございました
846名無しさん@お腹いっぱい。
2024/10/25(金) 18:41:18.55
アメリカの図書館がTwitterの公開ツイートをクロールしてるって話があったけど
イーロン体制になっても維持されてるのか、
そのアーカイブはwebで公開されているのか
は知らん
847名無しさん@お腹いっぱい。
2024/10/25(金) 19:01:30.35
復旧マダァ?(・∀・ )っ/凵⌒☆チンチン
848名無しさん@お腹いっぱい。
2024/10/25(金) 21:37:24.32
どっちみちイーロンになってからはまともにIAでは取れなくなってるし
849名無しさん@お腹いっぱい。
2024/10/25(金) 22:22:03.75
恒久的なアーカイブ方法って何があるんだろうな
電子の海にデータを放出すれば消えないはずだったのに
850名無しさん@お腹いっぱい。
2024/10/25(金) 23:59:56.39
ネット上の情報のほうが恒久的に消滅する可能性が非常に高い
だなんて15~20年くらい前には思いもしなかったよな
851名無しさん@お腹いっぱい。
2024/10/26(土) 00:20:26.02
アーカイブ冗長的に整備・一般化>
レアデータの争奪>
生成偽書が大量に出現>
収拾不能に
852名無しさん@お腹いっぱい。
2024/10/26(土) 00:36:36.01
>>850
ネット上の情報の方がってのは言い過ぎな気もするけどね
よく昔の石板や紙の文書が例に出されるけど、あれだって現代まで残ってるのは1%もないからね
853名無しさん@お腹いっぱい。
2024/10/26(土) 09:23:53.66
15年前でも大好きだった個人サイトの小説やニコニコの動画やコメントがある日突然跡形もなく一瞬で消えてもう二度と見れなくて泣いた事何度もあったからネットの儚さは気づいてた
それ以来少しでも気に入ったものはすぐにローカル保存できればアーカイブもするようになった
ネット情報は10年以上残ってるのですらほとんど無いってだいぶ前の調査記事で見たし
ある事件について調べようとしてもどんなに探しても不気味なほどネットには何も残ってなくて分からないのだと
この時代の情報は実は後の時代から見たらほとんど残ってなくて空白の時代になるんじゃないかとも危惧されてたり
自分の昔ブックマークしてたサイトもほぼ全滅
昔の情報あさっても2ちゃんの過去ログしかない事ばかり
デジタル情報ほど残らない諸行無常を感じるものもない
854名無しさん@お腹いっぱい。
2024/10/26(土) 13:58:34.39
繋がらないよ
855安倍晋三
2024/10/26(土) 20:17:09.69
お漏らし告知メール届いた
856名無しさん@お腹いっぱい。
2024/10/26(土) 21:00:04.15
登録してたん?
857名無しさん@お腹いっぱい。
2024/10/26(土) 21:13:24.41
捨てアドでしか登録してないから知る由もなし
858名無しさん@お腹いっぱい。
2024/10/26(土) 21:45:21.88
IAって無料でメアド登録したら
ファイルアップ出来るようになるの?
859名無しさん@お腹いっぱい。
2024/10/26(土) 21:50:58.45
こらぁいよいよ以てニコニココースかねぇ…
全面復旧すんのとこのスレが埋まんのはどっちが早いんだか…
860名無しさん@お腹いっぱい。
2024/10/26(土) 22:42:56.44
貴重な記録だよね
そのうちアメリカ政府が管理してくれたりしないだろうか…
861名無しさん@お腹いっぱい。
2024/10/26(土) 23:22:45.99
ケチな黄猿は黙ってろとか言われるぞ
862名無しさん@お腹いっぱい。
2024/10/27(日) 04:44:46.53
ファイルを圧縮してまとめてダウンロードする機能が死んでてイライラするんだけど、いつ復旧するとか情報ある?
代わりにtorrentで落とそうとしてみたけど、なんかバグってるみたいでダウンロードはしてるんだけどずっと0%のままみたいな感じになるし……。これ、なんかトレント側の設定で回避できたりする?
863名無しさん@お腹いっぱい。
2024/10/27(日) 08:43:21.48
いくつか μTorrent で試してみたけど、トラッカーも配信サーバもどちらも動いてる模様。

あれって .torrent の形はしてるけど、中身は P2P ではなく
GetRight というダウンローダによる BitTorrent プロトコル拡張、
トラッカーがダウンロードを指示する先は IA のサーバの HTTP 80 番ポート。
そのまま GetRight を使うか、BitComet や μTorrent のような
同じ実装を取り込んだ torrent クライアントでなければ落ちてこないだろうね。
https://web.archive.org/web/2/help.archive.org/help/archive-bittorrents/
864名無しさん@お腹いっぱい。
2024/10/27(日) 12:18:09.49
>>853
確かに言われてみれば諸行無常だな
いつのまにかWEBサイト消えてるか閉鎖してること多いし
永遠なんてなかったんだな
865名無しさん@お腹いっぱい。
2024/10/27(日) 14:15:19.74
>>863
ありがとう。Bittorrent使ってました! μTorrent使ったら問題なく落ちてきました。失礼しました。
866名無しさん@お腹いっぱい。
2024/10/27(日) 22:19:59.92
選挙速報とかもアーカイブしたら
時間軸でどう変化したか見れるのかな
867名無しさん@お腹いっぱい。
2024/10/27(日) 22:59:20.52
時間軸で見られたところで、あれって
(本来あってはいけないはずの) 個々の選挙区内の有権者数の差と、
開票作業に手当てできる人員の差でああいう流れが生じてるだけなんだよなー
868名無しさん@お腹いっぱい。
2024/10/28(月) 15:14:39.99
選挙で思い出したけどアメリカ大統領選って来月の5日だよね
それまでにはSPNも復旧してるといいが
869名無しさん@お腹いっぱい。
2024/10/28(月) 20:43:10.83
破産状態にあった取引先のIA魚拓がごっそり消されてた
グレーなうわさも聞いたが管財人が消す動機も無いし隠滅工作かなあ?
870名無しさん@お腹いっぱい。
2024/10/28(月) 23:08:20.17
"Wayback Machine failed to return archive information."

アーカイブをURLで検索しても、このメッセージがずっと出てくる
871名無しさん@お腹いっぱい。
2024/10/28(月) 23:09:20.59
書き込んでから気づいたが>>826で既出だね、すまん
872名無しさん@お腹いっぱい。
2024/10/28(月) 23:20:41.62
>>870-871
まだ直っていないという報告乙
873名無しさん@お腹いっぱい。
2024/10/29(火) 02:29:22.83
Firefoxだとアーカイブされてるページに飛べないのだが
Chromiumのブラウザだと飛べるが
Firefoxだと404 Not Foundが出てくる
874名無しさん@お腹いっぱい。
2024/10/29(火) 05:49:39.90
>>850
「ネットなら残る」「紙なら残る」というのが間違い
ネットだろうが紙だろうが、残す努力をしたものは残るし、
逆に誰も残そうとしなかったものは残らないってだけのこと
(稀に偶然残ることもあるが)
875名無しさん@お腹いっぱい。
2024/10/29(火) 06:19:16.18
>>853
ここだって昔の全然見られなくなってるからな
専ブラ使う人多いからウェブアーカイブには残されにくいし
運営のゴタゴタと荒らしと利用人口減で存続が怪しくなってきてる5chの未来考えるとすごく不安
876名無しさん@お腹いっぱい。
2024/10/29(火) 08:04:15.70
5ちゃん閉鎖するとなったら
5ちゃんのアーカイブごと消えたりして
削除申請出されてね…
877名無しさん@お腹いっぱい。
2024/10/29(火) 10:11:40.00
HTMLを気軽にDAT化する方法ってないの、逆じゃなくて
以前はあったと思うんだけど
878名無しさん@お腹いっぱい。
2024/10/29(火) 10:53:39.10
dat化ってなんの意味があんの?
879名無しさん@お腹いっぱい。
2024/10/29(火) 14:20:52.08
>>877
html2datみたいなツールがあるけど、半角スペースが連続した場合とかhtmlの段階で情報が抜け落ちてる場合があるから完全な変換は出来ない。
880名無しさん@お腹いっぱい。
2024/10/30(水) 01:08:55.04
>>875
5ちゃんの過去ログ全然戻らんからsc見てるわ
scって検索に全然かからんのが
881名無しさん@お腹いっぱい。
2024/10/30(水) 08:30:42.77
KADOKAWAグループサイト、4か月半ぶりに復旧
www.itmedia.co .jp/news/articles/2410/29/news186.html
ここの本格復旧(取得機能の復旧)は果たして・・・

ちなみに>>870の件は、数時間前は直ってなかったが、今見られた
882827
2024/10/30(水) 23:11:52.50
此閒のDoodleの🌗http://archive.Today/2024.10.23-222516/https://www.google.co.jp/
Orgでコレクトされてればアーカイブからプレイ出来たのかな?
https://doodles.google/doodle/rise-of-the-half-moon/
からプレイできるのはEnglish ver.

今日の🫧http://archive.Today/2024.10.30-023911/https://www.google.co.jp/
も日本語版で後でもプレイしたかった


https://web.archive.Org/web/20190809075335/https://web.archive.org/
例のイースターエッグは2019/08/09から仕込まれていた模様
他のページにも在るのか??w
https://web.archive.Org/web/20170421230602/https://web.archive.org/
2017/04/21からのはスライドの最後が置いてけぼりになる仕様

➡www.nhk.or.jp/ohayou/digest/2018/10/1018.html
のアドレスに置いてけぼりの画が在った記憶
だがアーカイブし忘れて又かくの如し。
883名無しさん@お腹いっぱい。
2024/10/31(木) 00:00:31.06
>>870
数日前までずっと出てた。昨日は出ずに読み出せた。だがしかし現在そうなってると言われても信じる
それぐらい不安定で一進一退してる
884名無しさん@お腹いっぱい。
2024/10/31(木) 14:43:27.67
セキュリティチェックのため機能は一時停止する事もあると前から説明されているのだが
誰も公式発表を見ていないのである
885名無しさん@お腹いっぱい。
2024/11/01(金) 18:42:48.07
進展あった?

>>884
まあ不安になるのもしゃーないだろ
わざわざ海外のX見る人のほうがまれだろう
886名無しさん@お腹いっぱい。
2024/11/02(土) 05:31:41.39
アカウントでログインできるようになったけど
Account settings のページは白紙のまま
887名無しさん@お腹いっぱい。
2024/11/02(土) 23:08:26.13
なんかsaveだけ出来ないがサイバー攻撃でも受けてるんか?
888名無しさん@お腹いっぱい。
2024/11/02(土) 23:21:13.96
/save/ 以外にも色々と出来てない
先月初旬のサイバー攻撃からの復旧作業中
889名無しさん@お腹いっぱい。
2024/11/02(土) 23:22:15.69
ハードディスク不足
890名無しさん@お腹いっぱい。
2024/11/04(月) 13:41:27.18
>>885
近日には動きがあるようなことがいわれてるが、果たして・・・
>-Save Page Now coming soon
 blog.archive .org/2024/10/28/internet-archive-services-update/
891名無しさん@お腹いっぱい。
2024/11/04(月) 13:47:33.40
大統領選までにSPN普及は厳しいか・・・
892882
2024/11/04(月) 13:50:35.04
>>890
煩わしいからリンクは直リンにして

🔜https://x.com/internetarchive/status/1851021456928305647
優先するのはログイン機能の方なのか?
流出って騒がれる割に、フィッシングメールが来る以外に実害に遭ってる奴いるのかな?
登錄者で何か被害に遭ったらこのスレにレポ4649

>>884
💳カードのセキュリティコードって
保存してるサイトばかりだヨネ

>>889
📊https://web.archive.org/web/*/https://web.archive.org/
同一のスナップが毎日毎日何百回も執られてるけど
完全同一の重複分をリダイレクト処理してなかったら容量が幾ら有っても足らん詰みゲー
>>882↕を査べる時も差分が判らなくて手閒だった

🆙
読み出し速度が遅いので速度の向上も期待したい
のと
archive.Todayには在るショートリンク機能をオプションでほしい
Orgのアドレスでは5chのメアド欄にリンクを仕込めんw

𝕏
archive.Todayは現在、Twitter(𝕏)は執れてるみたいだけど
画像直リンのpbs.twimg.com/media/*
が⥁Loadingから進まずに執れなくなってる
 ※Twitter(𝕏)の画像直リンアドレスは🔒 ⇄ 🔓でアドレスが変わる
893名無しさん@お腹いっぱい。
2024/11/04(月) 14:06:02.68
済まない、気持ちはわからないではないが、ちと前に直リンだか先頭だけ省略で書いたら規制に引っかかってさ(100%断定できるわけではないが)・・・
894892
2024/11/04(月) 14:25:09.22
>>893
あーなるほど。
今規制は敷かれてない模様
ディープリンク張りまくってる私がソースw

ドメインの . の閒にスペース入れてるでしょ
それだと
 ・半角スペースだと入ってる場所がフォントによってはパッと見判り難いのと
 ・右クリックから検索に掛けた時に該当アドレス(記事)が引っ掛からなくて
🖲から手を離して空白を消す作業が入って二度手閒になる
895894
2024/11/04(月) 14:27:07.56
Save Page Now!
896895
2024/11/04(月) 17:21:31.34
[ Save Page ]ボタンは押せる様になったけど
503 Service Unavailable
で執れないな

⛓‍💥
🌗https://web.archive.org/web/20241104034557/https://doodles.google/doodle/rise-of-the-half-moon/
https://web.archive.org/web/20220524034952/https://image.itmedia.co.jp/l/im/news/articles/2107/30/l_koya_ibmfont5.jpg
以前からこの様に、サイトの一部の画像が表示されないパターンがあるのだけど、

 ・読み出しエラーで時間を置いて後からアクセスすると画像が表示されるパターン
 ・取得ミスで画像が撮られてなくて表示される事は無いパターン

2パターンがあって紛らわしい
897名無しさん@お腹いっぱい。
2024/11/04(月) 20:15:15.77
ログインしてクッキー喰ってあると登録ユーザ向けオプションは提示されるけど、
いざリクエストを発行してもクッキーが無視されてるな。

Outlinks は拾えと言っても拾ってくれてないし、
一分間のリクエスト数上限 3 件とかいう縛りプレイ、話にならん。
898名無しさん@お腹いっぱい。
2024/11/05(火) 02:21:49.40
動作は遅いし不安定だけどSPN動いてるっぽいな
899名無しさん@お腹いっぱい。
2024/11/05(火) 06:23:22.25
ログインしてるのにこれは無いよ
900名無しさん@お腹いっぱい。
2024/11/05(火) 06:57:11.65
割れダウンロードしすぎなんだよ
901名無しさん@お腹いっぱい。
2024/11/05(火) 07:24:36.99
>>900
もうちょっとシステムに絡んだ面白いことを言えよ低能
そりゃ https://archive.org/details/software から拾ってくるのは割ればかりだけどw
902名無しさん@お腹いっぱい。
2024/11/05(火) 08:32:52.76
Save Page Now による保存が心なしか速くなっているような気がするのは気のせい?
903名無しさん@お腹いっぱい。
2024/11/05(火) 09:07:37.93
恐らくリクエストの総数が減ってるからじゃないかなぁ。

クッキーも S3 API Key もユーザ認証は機能してないらしく、
https://web.archive.org/save/ で URL を入力する分には非ログインとして動作するけど
JSON を使う方は 401 Unauthorized となって何もできない状態。
904名無しさん@お腹いっぱい。
2024/11/05(火) 10:05:57.64
>>903
認証に失敗するので「再開にあたって今までの key を無効に
したのかな?」と思って Get Your S3-Like API Keys ページに
行ってみると secret key が変更されていました。
書き換えて認証に成功しました。
905903
2024/11/05(火) 12:29:34.99
>>904
あーほんとだ、ありがとうございます!!
906名無しさん@お腹いっぱい。
2024/11/05(火) 16:42:54.21
>>897>>899
1分間に3件まで、1日に200件までは復旧まもないゆえの肩慣らしなのか、それともまさか今後はそれがデフォルトなのか・・・
「Job failed.」が頻繁に出るときは特にきつい
むろん使えないほぼ1か月間よりは増しだが・・・
907名無しさん@お腹いっぱい。
2024/11/05(火) 17:07:50.76
復帰してすぐに元通りになるわけないじゃろ
908名無しさん@お腹いっぱい。
2024/11/05(火) 17:09:57.35
マンガ図書館閉鎖!
閉鎖ばっかりだ
909名無しさん@お腹いっぱい。
2024/11/05(火) 18:04:49.52
IAみたいに規模のでかいミラーサイト他にないの?
910896
2024/11/05(火) 22:59:04.63
🔙https://x.com/internetarchive/status/1853545508121567287
(発表が)後手後手な広報w
>Web pages archived since October 9 will start being added to waybackmachine.
November 4じゃないのはどういう意味?
🗓https://web.archive.org/web/20240000000000*/https://www.google.com/
空白期間は 2024/10/10 ~ 11/4
だけど2日に執られてるの在るな

>>896の❔
画像が表示されてなかったんだけど
昨日 /20241104065933/ が執られた後に表示される様になって、
2022年の /20220524034952/ に表示されてる画像は
2024年の📁https://web.archive.org/web/20241104091531im_/https://image.itmedia.co.jp/news/articles/2107/30/l_koya_ibmfont5.jpg
となってる。(※右クリックメニューの「画像を新しいタブで開く」から画像だけを表示できる)

これって
 ・取得ミスで画像が撮られてなくて表示される事は無いパターン
の過去スナップは、
同一アドレスの当時とは違う未来画像がオーパーツされてしまう仕様では?

𝕏/🖼
archive.TodayのTwitter(𝕏)画像直リンアーカイブ不可は、
画像直リンアドレス🔗「pbs.twimg.com/media/~」を𝕏内でポストして
そのリンクを右クリックから[リンクをコピー]したTwitter(𝕏)のショートリンクアドレス🔗「𝑡.𝑐𝑜/~」
で保存を懸けるとリダイレクトしてアーカイブする事がreached for the moon
 📫
 5chのメアド欄リンクは専ブラからしか見れない模様
 2ch(sc)の方ではメアド欄リンクが再現されない仕様だった
911名無しさん@お腹いっぱい。
2024/11/06(水) 13:33:39.17
ログインできてアカ削除しようとしたら読み込みが終わらずメアドだけでも変更したら変更を受け付けなかったよ
912名無しさん@お腹いっぱい。
2024/11/06(水) 19:26:28.47
>>911
発障さん乙
どういう状況なのかさっぱり解らん
913名無しさん@お腹いっぱい。
2024/11/06(水) 19:39:19.37
>>909
https://warp.ndl.go.jp/contents/reccommend/world_wa/index.html
閲覧だけで良かったらいくつかあるようだが、取得までできるのはarchive.todayかウェブ魚拓ぐらいしかないかと
ただ、後者はIAより厳しい1日60件まで
前者が1日何件までなのかは特に見あたらないが、少なくとも後者よりはゆるいか(最近60件どころではないレベルを取得したことだし)
914名無しさん@お腹いっぱい。
2024/11/06(水) 21:37:27.46
・大規模アーカイブ
・閲覧・保存が可能
・運営元が明確
の3つを満たしてるのはIAくらいしか無いだろうね
915名無しさん@お腹いっぱい。
2024/11/06(水) 22:36:43.63
archive.todayは同じドメインのURLを17000以上アーカイブするとNginxに飛ばされる
916名無しさん@お腹いっぱい。
2024/11/07(木) 00:11:47.84
SPN復旧の件の記事
https://www.itmedia.co.jp/news/articles/2411/06/news168.html
あとはログイン絡みの問題か
917名無しさん@お腹いっぱい。
2024/11/07(木) 04:19:17.26
ログインからアカウント設定に入りパスワードの変更はできるようになったけど
メールアドレス変更がまだできないね。
新アドレスを入力して、認証 URL の記載されたメールが届く所までは良いけど
その URL を開いてもエラーとなって機能していない。

アカウント削除と表示名変更は試してないので判らない。
(一度使用した表示名は「使用済み」となって、元の所有者ですら戻せないシステムだったはず・・・)
918910
2024/11/07(木) 08:39:20.97
4日の再開後に執れてたアーカイブ、
再アクセスすると

 >𝐇𝐫𝐦.
 >The Wayback Machine has not archived that URL.
 >Click here to search for all archived pages under ~

となってて表示されなくなってるarchivedが存在する模様

今⛓http://2chb.net/r/win/1642086530/879n
 の2番目の🔗がその状態  (⬆>>786の /web/0if_/ を活用)

  🌌のno+eのは
   >a snapshot was captured. visit page: 🌌https://web.archive.org/web/20241106035458/https://note.com/onopko/n/n37d8740b2f84
   >there was a delay in registering this snapshot with the wayback machine.
   >you may be redirected to a previous version right now.
   >this snapshot will be available later.
  からずっと𝐇𝐫𝐦.で一度も表示されない

>>896の❔は、
ウェブ開発ツールから視れる画像のURLが✅https://web.archive.org/web/20220524034952im_/https://image.itmedia.co.jp/news/articles/2107/30/l_koya_ibmfont5.jpg
となってるけど
存在してなくてリダイレクトで>>910📁になってる模様

復旧の調整でのthis snapshot will be available later.じゃなかったら
Orgはシステム的にTodayよりぁゃιぃ

  🆜https://archive.Today/9VIeR/image
   ロングリンクがほしいTodayの足元がおるすなスクリーンショット機能

>>917
Sign upで使ってたらどんなメリットが或ったのかkwsk
919名無しさん@お腹いっぱい。
2024/11/07(木) 09:28:23.84
糖質はスルー推奨
920名無しさん@お腹いっぱい。
2024/11/07(木) 10:41:27.70
IAでアカウント作るメリットって何?
921名無しさん@お腹いっぱい。
2024/11/07(木) 19:59:38.48
1分・1日に取得できる件数が違う
ただ、今のところ>>897>>899のとおりだが
922名無しさん@お腹いっぱい。
2024/11/07(木) 20:02:13.90
糖質はスルー推奨
923名無しさん@お腹いっぱい。
2024/11/07(木) 21:11:07.17
アーカイブチームが図書館zのプロジェクト開始してるっぽいな
というかveohも閉鎖するんだなアーカイブチームのwikiで気づいた
924名無しさん@お腹いっぱい。
2024/11/07(木) 22:37:18.63
IAってマンガ図書館Zみたいな電子コミックサイトの画像ちゃんと保存されるのかね
925名無しさん@お腹いっぱい。
2024/11/07(木) 23:40:43.13
Internet Archive総合 (web.archive.org) #5 YouTube動画>3本 ->画像>69枚
926918
2024/11/08(金) 03:52:00.97
>>918の⛓、
その後 3番🔗4番🔗も𝐇𝐫𝐦.化
>>910🗓の2日と3日の🔵も消えてる事から、
11/2日~7日に執られたarchiveがランダムに消えたと想われる(1番🔗は生存)

 2番3番4番🔗は先ほど再取得したら表示される様になった(capture数は1)
 🌌のnote.comはOrgでは執れない模様

>>897, >>921
☑Save screenshot
がToday(>>918🆜)の様にアドレスがあるものだったら
例にここに貼ってみて
927名無しさん@お腹いっぱい。
2024/11/08(金) 07:08:19.60
絵文字は読みづらい
情報は嬉しいんだが普通に書いてくれ…
928名無しさん@お腹いっぱい。
2024/11/08(金) 07:30:33.48
糖質はスルー推奨
929名無しさん@お腹いっぱい。
2024/11/08(金) 08:59:12.05
HTML フォームからアーカイブを採る際の縛りプレイ状態、このままでは埒が明かないので
HTTP ヘッダを操作するブラウザアドオンで Authorization ヘッダを挿入することにした。
Outlinks もちゃんと拾ってくれる。
https://web.archive.org/save/status/user もエラー無く保存件数等が確認できる。

https://web.archive.org/save/ のページ自体はクッキーしか見ていないので、
この入力フォームを使う場合はクッキーも喰っておく必要あり。
930926
2024/11/08(金) 10:08:42.66
>>926🔗🔵𝐇𝐫𝐦.の件は、
本日早朝に復旧された模様
こういう細かいトラブル情報もTwitter(𝕏)で発信してくれヨナ

 無駄ァに二つスナップを執ってしまった
 『https://web.archive.org/web/20241107192258/http://hobby-room-pearl.%73akura.ne.jp/jump/daiamon/74-07-jojo2-3.jpg』

>>910❔📁オーパーツ化問題はそのまま
画像部がミスキャプチャで読み出せない大過去のアーカイブは多い

>>927
普通=オールドタイプ
なので無理

 絵文字は
  ・引用用のタグ
  ・リマインダー(リンク先に何が在ったかの要約)
 で用いてる
 使わなかったら更に説明文が入って無様ね
 読んでもらう為にレスを書(置)いてるのではないので
 無理に読まなくても大丈夫だ、問題ない

絵文字は元Twitter社員のtwemojiがエモいので
🔀https://github.com/13rac1/twemoji-color-font
で置き替えておいた方がベネかもね
931名無しさん@お腹いっぱい。
2024/11/08(金) 10:27:50.08
糖質はスルー推奨
932名無しさん@お腹いっぱい。
2024/11/08(金) 10:41:54.61
>>929
>HTTP ヘッダを操作するブラウザアドオンで Authorization ヘッダを挿入することにした。
 そこのところが気になる
 それを導入して前と同様に使えるのならぜひ導入したいが
933名無しさん@お腹いっぱい。
2024/11/08(金) 17:46:02.81
所でarchive.orgのコレクションの新規アップロードってまだ出来ない感じ?
特に上げるもん無いけど物の試しにアップロードページへ行ったらこんな画面になるんだが…
https://archive.is/kOZWG/f002d291c83ae0be7211a02f27dede9a81e685dd.webp
934名無しさん@お腹いっぱい。
2024/11/08(金) 18:17:11.19
>>927
こいつの情報、ここでは既知の情報しかないぞ
noteが取れないとか何年前の話だよ
935名無しさん@お腹いっぱい。
2024/11/08(金) 19:45:07.07
>>933
https://archive.org/about/403.html ですね。
>>917 のメアド変更の認証 URL も同じリダイレクト、
まだ復旧していない機能を使おうとするとそこに飛ばされるのだと思います。

>>932
アーカイブリクエスト時のユーザ認証が完全に死んでるかと思っていたのですが、
>>904 さんに API key による認証が機能していることを教えていただいたので
(パスワードが変更され認証失敗していただけだった)
ブラウザからもそれを使うようにしてみた次第です。
ここで API key の送信に使っているのが Authorization ヘッダ、
Save Page Now 2 Public API Docs (>>3) の Capture request の項に説明があります。
936名無しさん@お腹いっぱい。
2024/11/08(金) 20:48:09.43
米国インターネットアーカイブの目指すこと――その理念、著作権という現実、AIとの関係
https://internet.watch.impress.co.jp/docs/news/1491372.html
937名無しさん@お腹いっぱい。
2024/11/08(金) 21:28:04.88
へぇ
938名無しさん@お腹いっぱい。
2024/11/09(土) 02:00:30.89
ニコニコ静画を取ろうとしたらhttps://www.nicovideo.jp/region_restrictionにリダイレクトされてしまった
エロ系以外でも地域制限かかるのかよ・・・
939930
2024/11/09(土) 10:01:24.76
https://web.archive.org/web/20240801142256/http://web.archive.org/screenshot/https://webapps.stackexchange.com/
☑Save screenshot機能ってのは☝らしい

現在、そのスクショのアーカイブアドレス: 🔲https://web.archive.org/web/20240801142248/https://webapps.stackexchange.com/
はアーカイブではない元のURLにリダイレクトされてしまう仕様になってる然様
こういう時の為に使うのか?
 ・スクリーンショット ⇄ アーカイブの切り替えがTodayの様に出来ないのと、

 ・Orgのスクリーンショットは足元は居留すけど画質がjpgで劣化しててリテラが低い
  Todayは無劣化のpng(>>918🆜)

   >>933に使われてるGoogleの新規格のWebPは
   圧縮率がpngよりも高いけど、
   可逆(VP8L)と不可逆(VP8)で拡張子を別けて定義できないGoogleは理念が低い

   SEOにページ表示速度を入れてるが、
   速さよりも質
   速度は後から改良が見込めるけど質は上げ治さない限り不良(WebPには上限も在るらしい)

2ch(sc)のアーカイブがOrg, Today共に執れなくなってる
 2ch(sc)は1000落ち後のdat化をミスって
  >[エラー]
  >datが存在しません。
 になるスレが在ったから、アーカイブを執れないと🜄物

この近頃多発な執れないドメイン問題、
正体不明のToday: 🪆https://gigazine.net/news/20240326-archive-today/
には、どんな手を遣ってでも執れる様に期待w

>>934🙈→>>829
🪬http://2chb.net/r/hard/1717147167/1000n
𝐇𝐔𝐌!→𝐇𝐫𝐦.でバイツァダストが关ってるとか本来は生涯を通して知らせる事は無い
940名無しさん@お腹いっぱい。
2024/11/09(土) 10:12:51.41
糖質はスルー推奨
941名無しさん@お腹いっぱい。
2024/11/10(日) 07:36:27.44
ちんこ!
942名無しさん@お腹いっぱい。
2024/11/10(日) 16:22:10.69
http://thai.jinsei.link/jumborg-ace-toy-thailand/
↑を取得しようとすると、404なってしまう
ほかのサービスだとウェブ魚拓はNG、Archive.todayはOK
943名無しさん@お腹いっぱい。
2024/11/10(日) 16:50:33.24
>>942
HTTP HEAD が投げられると 404 を返すとか、そういうパターンか。
直接 GET で行けば採れるっぽい。
https://web.archive.org/web/20241110074334/thai.jinsei.link/jumborg-ace-toy-thailand/
944名無しさん@お腹いっぱい。
2024/11/14(木) 15:21:11.41
このAPIはまだ使えないのか
https://archive.org/help/wayback_api.php
945名無しさん@お腹いっぱい。
2024/11/14(木) 15:44:57.62
ヘルプページが死んだままだからって API も死んだままとは限らんよね
946名無しさん@お腹いっぱい。
2024/11/14(木) 21:00:37.15
新規にページ保存しても保存されてない扱いで返ってくるな…
またクラッカー共にやられてんのか?
947名無しさん@お腹いっぱい。
2024/11/16(土) 09:12:00.56
outlinks復活したな
948名無しさん@お腹いっぱい。
2024/11/16(土) 11:13:46.48
>>947
クッキーによるユーザ認証が復活していますね
その前も Authorization ヘッダで認証すれば outlinks は拾ってくれていました
949名無しさん@お腹いっぱい。
2024/11/16(土) 15:16:50.38
絵文字糖質は今週末は休みかなw

メールアドレス変更を試して、認証 URL が機能せず失敗、を何回か繰り返すと制限が掛かるのね
本垢でやらなくて良かった
新規アカウント認証用の https://archive.org/account/verify.php は動いてるけど
メアド変更認証用の https://archive.org/account/verify-email.php はエラーのまま
950939
2024/11/16(土) 20:47:22.99
authorization: LOW = >>949のWAISのスコアがLOW
なシークレッドコードにも一生気付かなそう
@internetarchiveのポスト見ても絵文字がどーたら言ってんのかな

 >>ssspは>>793で必要の無い99を調べてる処からもLOW
 統合失調者の20年近く前の記憶など訊いてない
 0 = 最古が事実

正直ssspのレスは登錄する必要がない輩 = HIGH(myaccesskey:⬆)には只のゴミレス

>>936
Todayの様な匿名サイトで再構築しないと
>>939の🔲な事態となるのがLaw

𝐇𝐫𝐦.化したアーカイブは
時限で治ってるリンクと治らないリンクがある様なので
再チェックが必要
951名無しさん@お腹いっぱい。
2024/11/16(土) 23:17:45.36
>>950
もうちょっと根本的な反論をしてみろよ低能糖質
952950
2024/11/16(土) 23:46:16.10
>>951=低能糖質の遠吠え(ワラ
953名無しさん@お腹いっぱい。
2024/11/17(日) 05:01:30.32
糖質はスルー推奨
954名無しさん@お腹いっぱい。
2024/11/19(火) 16:52:55.54
SSブログ(so-netブログ)がサービス終了だって
955名無しさん@お腹いっぱい。
2024/11/19(火) 23:08:27.12
俺環だけかもしれないが、21時台から(それまではなんともなかった)
https://web.archive.org/saveまではつながるのに、取得しようとするとNot FoundだったりService Unavailableだったり
956名無しさん@お腹いっぱい。
2024/11/19(火) 23:20:30.61
と思ってたらJob failed.とかSave Page Now could not capture this URL because it was unreachable.とかThe server didn't respond in time forとか出るもののつながった
957名無しさん@お腹いっぱい。
2024/11/20(水) 15:36:51.32
>>582
2024/12/20 閉鎖 vectorの作者個人ページ >>505
2025/03/31 SSブログ終了 https://blog-wn.blog.ss-blog.jp/2024-11-15
やれやれ、
958名無しさん@お腹いっぱい。
2024/11/20(水) 21:30:21.15
SSブログはArchiveTeam辺りが取ってくれないかな
頼み方?が分からんけど
959名無しさん@お腹いっぱい。
2024/11/20(水) 21:39:48.24
これホスティングしているブログのID一覧って取る手段ない感じ?
新着記事一覧とか見てもページングが20件くらいしかない
URLの形式はこうと。
https:// [*].blog.ss-blog.jp/

新着1000件はこれで見れるが…
https://blog.ss-blog.jp/index.xml
960名無しさん@お腹いっぱい。
2024/11/20(水) 21:43:49.85
2024/09/30 閉鎖 アキバ総研 >>524-527
2024/12/20 閉鎖 vectorの作者個人ページ >>505
2025/03/31 閉鎖 魔法のiらんど >>653
2025/03/31 閉鎖 SSブログ https://blog-wn.blog.ss-blog.jp/2024-11-15

あれ、iらんどと同じ日なのか…
961名無しさん@お腹いっぱい。
2024/11/20(水) 22:13:38.94
>>959
そういう込み入った検索は CDX Server API で。
https://archive.org/developers/wayback-cdx-server.html
962961
2024/11/20(水) 22:15:53.34
そうか必要なのは blog.ss-blog.jp のサブドメイン一覧か
勘違いした申し訳ない
963名無しさん@お腹いっぱい。
2024/11/20(水) 22:17:11.23
>>961
それだと既にアーカイブされているURLしか見つからない訳で、
既にアーカイブされてるなら、あれ もうする事なくねって思っちゃう…
まあ各ブログの個別の記事を改めて明示的にアーカイブするとかあるけどさ。
964961
2024/11/20(水) 22:59:18.37
>>963
ええ、勘違いです申し訳ないです
ざっと見たところでは、全部取れそうな場所は見つかりませんでした
965名無しさん@お腹いっぱい。
2024/11/21(木) 00:15:46.82
>>964
サンキュー。
vectorはurlが連番だったから全部叩いて一覧作れたけど、
こっちはそうもいかず か…。
966名無しさん@お腹いっぱい。
NGNG?2BP(1000)

EchoAPIはAPIの管理とテストをシームレスに行うためのツールとなっていて、Web開発もずっと簡単で効率的にしてる!
967名無しさん@お腹いっぱい。
2024/11/23(土) 23:53:23.83
>>920
IAと契約して魔法使いになってよ

通常英語になるアマゾンを日本語でアーカイブさせた例

一般人:https://archive.is/FVU6Z
    買った商品の記録に「おま国」発動
    This item cannot be shipped to your selected delivery location. Please choose a different delivery location.
魔法使:https://archive.is/wEGlh

一般人:https://archive.is/pNf8p
魔法使:https://archive.is/HPeoy
968名無しさん@お腹いっぱい。
2024/11/24(日) 02:14:59.06
愛知県民さんこんばんわ
https://web.archive.org/web/20241123165747/www.%61m%61zon.co.jp/dp/B0CKLF9WBB
969名無しさん@お腹いっぱい。
2024/11/25(月) 04:37:31.60
5chの古いスレの過去ログが復活したから見れるうちにアーカイブ
復活した過去ログは
https://itest.5ch.net/kako/test/read.cgi/板名/1690495133
https://kako.5ch.net/test/read.cgi/板名/1690495133
この2パターンあるけどまあどっちでもよさそう。個人的には前者の方が見やすい。
970名無しさん@お腹いっぱい。
2024/11/25(月) 09:40:02.39
しまった、マンガ図書館Zも明日閉鎖か!
マンガ本体はともかく作品一覧だけでも作っておこうと思ったんだが…もう遅い

2024/09/30 閉鎖 アキバ総研 >>524-527
2024/12/20 閉鎖 vectorの作者個人ページ >>505
2024/11/26 12時 閉鎖 マンガ図書館Z https://closing.mangaz.com/info/2114/index.html
2025/03/31 閉鎖 魔法のiらんど >>653
2025/03/31 閉鎖 SSブログ https://blog-wn.blog.ss-blog.jp/2024-11-15
971名無しさん@お腹いっぱい。
2024/11/25(月) 21:20:21.46
今年はサービス終了地獄だったな
来年とか更にどうなってしまうのか
972名無しさん@お腹いっぱい。
2024/11/25(月) 22:43:13.28
>>969
復活したけど .dat が無いんよね・・・
973名無しさん@お腹いっぱい。
2024/11/25(月) 23:07:12.40
>>972
つ datのようなもの
https://itest.5ch.net/public/newapi/client.php?subdomain=kako&board=esite&dat=1189771222
974972
2024/11/26(火) 00:02:44.94
>>973
懐かしいなあ
5ch の API 騒動が始まったころ、専ブラに刺した串で試したことがあります
975名無しさん@お腹いっぱい。
2024/11/26(火) 08:55:37.37
このままいくと2000年代のネット情報は殆ど何も残らなくなりそうだな
ガラケー関係は既に死滅状態だし
976名無しさん@お腹いっぱい。
2024/11/26(火) 20:15:48.50
10年以上前の個人サイトのエロ小説とかこう残ってたらなあと期待するがそううまくいかんな
977名無しさん@お腹いっぱい。
2024/11/26(火) 21:49:12.41
エヴァのオリキャラ上等時代のSSとかどこにあるかな
当時のGAINAXは許可サイトのURL一覧ページ作っていたからそこから辿れば見れるかな
978950
2024/11/28(木) 12:28:18.20
>>954
ソラ、Soよ

>>967-968
なのラ!

≫953🙉はSikiのデフォルト設定にすらDerezzedされてる事も死ぬまでシラなソう

>>955-956
アーカイブしたページがランダムに𝐇𝐫𝐦.化して未採取になるバグの残存リンクも19日に復旧された
4日に執って検証用に再アーカイブを賭けなかったリンクは19日迄ずっと𝐇𝐫𝐦.状態だった

>>939🔲のStack Exchangeも現在はリダイレクトされずにアーカイブが表示される
が、
currently facing some limitationsな𝕏(Twitter)ら辺は、訴えてやられたら全アーカイブボッシュート鴨葱(ビッグデータ至上主義)
そもそも🏛Internet Archiveは、

 IA/イエーイ “われ”がダウソたら、🛂https://www.aozora.gr.jp/cards/000879/files/127_15260.html

Wayback MachineにLog in機能は要らん
 ⌫24時間以内同一IPからならミスキャプチャアーカイブを削除できる機能
がOrgにもTodayにもジェバンニにも要る
Orgはミスキャプチャが多過ぎ!

・note.comの不可文が
  >Sorry.
  >This URL has been excluded from the Wayback Machine.
 ではない>>918🌌
・オーパーツ(>>910❔📁: 無納アドレスを納近アドレスに代替してしまう>>793的なバグ)
が繼続

>>>>>>882➡ ≒ ⬏https://web.archive.org/web/0if_/https://pbs.twimg.com/media/GdcL8DKaMAAA94R?format=png&name=orig
979名無しさん@お腹いっぱい。
2024/11/28(木) 16:33:38.30
糖質はスルー推奨
980名無しさん@お腹いっぱい。
2024/11/28(木) 16:59:05.05
今回のトラブル中に残せなかったのがいくつもある
981名無しさん@お腹いっぱい。
2024/11/29(金) 14:13:19.70
>>970
https://info.seesaa.net/article/505833903.html
閉鎖では(現状)ないが、Seesaaブログ運営会社がしたらばに変更

そういやしたらば(ライブドア)掲示板も過去との連続性どうなってんだろうな
大昔に作って放置されてる掲示板とかどうなってんだろ
982名無しさん@お腹いっぱい。
2024/11/29(金) 18:00:28.51
>>981>>970
SSブログのファンコミュニケーションズってどこかで聞いたことあるなと思ったらSeesaaブログの会社か
1つは廃止、1つは他社に譲渡するとはどこで違いが出たんだろうな
983名無しさん@お腹いっぱい。
2024/12/01(日) 00:06:04.89
vectorの個人作者ホームページ終了まで残り20日
984名無しさん@お腹いっぱい。
2024/12/01(日) 00:22:20.42
アーカイブって訳じゃないけど一覧は作って公開した。他に出来る事って無いよね
985名無しさん@お腹いっぱい。
2024/12/01(日) 03:08:01.63
x.com でこんなのが出た。
986名無しさん@お腹いっぱい。
2024/12/01(日) 07:44:18.59
>>984
アキバ総研の時にも一覧サイト作ってた人か、ありがてえ...
あとはアーカイブしていくだけだな
手始めに一覧サイトの1~270ページ目のFirst Archihveをいただいておいた
987名無しさん@お腹いっぱい。
2024/12/01(日) 17:00:55.92
Vectorはもうarchivebot に投げられているっぽいな

https://archive.fart.website/archivebot/viewer/?q=hp.vector.co.jp
https://transfer.archivete.am/Upgah/hp.vector.co.jp-authors-VA-200.txt
988名無しさん@お腹いっぱい。
2024/12/01(日) 22:00:56.00
>>987
こんなサイトあったのか知らなかった
989978
2024/12/02(月) 01:43:19.42
🔭https://web.archive.org/web/20210708121508/https://kemur.jp/retro-star-viewer-210607
 Org恒例の画像が表示されないパターンのアーカイブだったけど、
 ダウソ板で使う予定の一枚を11月28日にキャプチャしたら他画像も2024/11/30から未来トランクス
  現在は、サムネが途中からひどくありふれたホワイトノイズだがTodayからは観らるる: 👍https://archive.Today/Gj67i

🏛https://archive.Today/vcfxp
 >同時点で収集されたものとは限らず、1年以上の時間差があることも稀ではない。
🧳Internet Archive総合 (web.archive.org) #5 YouTube動画>3本 ->画像>69枚
 実際に同一URL差し替え異画像をチェ───ンジ!!!!!しもうてたら//web.chimera.orz/

🖼画像の欠けたアーカイブは、クローラーやsave-page-now-outlinksの仕業じゃ! >>>134-143
このポンコツ仕様、中の誰一人としてコレジャナイと思わんのか?
 >>918❔✅アドレスはoutlinksの無納 ∴ outlinksは(゚⊿゚)イラネ

 複アカまで使ってキャプチャ数制限をリミットブレイクしちゃってるこのスレの██は
 セーブしたアーカイブの🧬Internet Archive総合 (web.archive.org) #5 YouTube動画>3本 ->画像>69枚
 なんてまずcf.してないヨネ。██だから

>>910🗓
OCT 11~NOV 1が🈳だったのが現在は🔵
ご乱立botクローラが無駄ァに重合しまくってるナニコレ珍千景、
NOV 24の8450 snapshotsとか総アーカイブ数🜄増しの為にやってんの?w

 🔵は、統合者ならクローラ採取や直前との差分発生を記号や色で標示するけどな(💠な区画型アイコンだと多彩標現可)

🇧🇷のURLを5chに記入出来なかった自称魔法使の>>967
>>978⬏のクッキーさんのツイートをダウソ板で遣う調和だから魔法でアーカイブ録っといて
それ、𝕏からログアウトしてると観測問題できない特殊アドレス
 🂡
 あべべのべを🚉https://archive.Today/vcfxp/imageしたのは
 山上ではなく式神なのは🤫デスけ
  ⌦⛎Internet Archive総合 (web.archive.org) #5 YouTube動画>3本 ->画像>69枚
990名無しさん@お腹いっぱい。
2024/12/02(月) 07:23:55.43
糖質はスルー推奨
991名無しさん@お腹いっぱい。
2024/12/02(月) 19:14:25.43
ぷららのホームページサービスが来年3月31日に終了するらしい
https://www.docomo.ne.jp/info/notice/page/240627_01.html
992名無しさん@お腹いっぱい。
2024/12/03(火) 02:41:40.51
http://www{1~20}.plala.or.jp/名前
http://business{1~4}.plala.or.jp/名前

ちょっと見てみたら紅白歌合戦完全マニュアルってサイトはぷららホームページサ終と共に閉鎖するそうな
http://www1.plala.or.jp/nakaatsu/
こういうサイトが結構多いかもしれない
993名無しさん@お腹いっぱい。
2024/12/04(水) 10:04:54.60
>>991
うおっこれは知らんかった。しかも発表済みだったのか
994名無しさん@お腹いっぱい。
2024/12/04(水) 11:50:00.86
ネッ糖フリチャックス
995名無しさん@お腹いっぱい。
2024/12/04(水) 15:09:55.27
Internet Archive総合 (web.archive.org) #6
http://2chb.net/r/esite/1733289042/
996名無しさん@お腹いっぱい。
2024/12/04(水) 21:53:14.78
テンプレの>>8
次スレに貼ろうとしたら吸い込まれたんよね
997名無しさん@お腹いっぱい。
2024/12/05(木) 01:28:59.57
>>996
どうやら可能+URLが規制対象になってるっぽい
可.能になおして貼っておいた
998名無しさん@お腹いっぱい。
2024/12/05(木) 07:28:59.96
>>997
そういえば、そんな組み合わせをターゲットにした規制がありました
ありがとうございます
999名無しさん@お腹いっぱい。
2024/12/05(木) 12:58:52.94
>>995
乙アーカイブ
1000名無しさん@お腹いっぱい。
2024/12/05(木) 13:05:39.45
1000
-curl
lud20241224022020ca
このスレへの固定リンク: http://5chb.net/r/esite/1690495133/
ヒント:5chスレのurlに http://xxxx.5chb.net/xxxx のようにbを入れるだけでここでスレ保存、閲覧できます。

TOPへ TOPへ  

このエントリをはてなブックマークに追加現在登録者数177 ブックマークへ


全掲示板一覧 この掲示板へ 人気スレ | >50 >100 >200 >300 >500 >1000枚 新着画像

 ↓「Internet Archive総合 (web.archive.org) #5 YouTube動画>3本 ->画像>69枚 」を見た人も見ています:
Internet Archive総合 (web.archive.org) #1
Internet Archive総合 (web.archive.org) #2 
Saint Snow PRESENTS LOVELIVE! SUNSHINE!! HAKODATE UNIT CARNIVAL 〜Aqoursイベント総合スレ119日目
【F2/Power3】 Umidigi 総合 Part 48【A3S/A3X/Uline】
Horizon ホライゾン Zero Dawn/Forbidden West 総合 part85
【PS4】Destiny総合 part928 【デスティニー】 [無断転載禁止]©2ch.net [無断転載禁止]
【匿名通貨】Verge総合 Part.22【XVG】
【匿名通貨】Verge総合 Part.25【XVG】
TBSチャンネル総合 Part730 (c)2ch.net
【MHW】MONSTERHUNTER WORLD MOD総合 part3
【IE10】 Windows Internet Explorer 10 Part5
【VR】SteamVRソフト総合 Part47【Vive/Rift/WinMR/Pimax】(ワッチョイ有)
【VR】SteamVRソフト総合 Part30【Vive/Rift/WinMR/Pimax】(ワッチョイ有)
【VR】SteamVRソフト総合 Part28【Vive/Rift/WinMR/Pimax】(ワッチョイ有)
【プロセカLIVE 1st-Link】初音ミクLIVE総合 part454【MIKU WITH YOU 2021】
【VR】SteamVRソフト総合 Part19【vive/Rift/OSVR/FOVE/WinMR/Pimax】(ワッチョイ有)
Nintendo Switch総合スレ★273 (c)2ch.net
【HMD】SteamVR総合 Part99【VIVE/Rift/WinMR】
Horizon ホライゾン Zero Dawn/Forbidden West 総合 part81
Horizon ホライゾン Zero Dawn/Forbidden West 総合 part114
Horizon ホライゾン Zero Dawn/Forbidden West 総合 part118
Horizon ホライゾン Zero Dawn/Forbidden West 総合 part102
NHK総合を常に実況し続けるスレ 140610 Nothing's Carved In StoneVS9mm Parabellum Bullet
<a class="image" href="https://rz.anime-tube.win/pic.php?http://jump.5ch.net/?https://i.imgur.com/rPi5wkm.jpg" target="_blank">https://rz.anime-tube.win/pic.php?http://i.imgur.com/rPi5wkm.jpg</a> </a><br>・<a rel="nofollow" href="/r/newnew8/1526969625/"><img calss=
23:41:56 up 2 days, 45 min, 0 users, load average: 9.49, 10.70, 10.62

in 4.0120851993561 sec @4.0120851993561@0b7 on 011513