【保存・記録】ウェブアーカイブ総合 Page.01 ニコニコ動画>1本 ->画像>14枚

1192.168.0.7742019/04/06(土) 21:31:22.29ID:KqAD+H9+0

ウェブアーカイブ関連の話題を総合的に扱うスレです。
情報交換し合って貴重なインターネット遺産を後世に残しましょう。
Internet ArchiveなどのWebサービスだけでなく、wget・HTTrack・Heritrix等のツールやソフト、自作クローラの話題もOKです。

・関連リンク（Rock54回避のためピリオドをカンマに変更）
Wayback Machine
https://archive,org/
archive,today
https://archive,fo/
ウェブ魚拓
https://megalodon,jp/
Archive Team
https://archiveteam.org/

・関連スレ
Internet Archive総合 (web,archive,org) #2
http://2chb.net/r/esite/1475246713/
ウェブ魚拓 Part3
http://2chb.net/r/esite/1498902308/
【和塩】geocitiesスレ10【ジオシティーズ】
http://2chb.net/r/hosting/1554115546/
【ヤフー】Yahoo!ブログ【アーカイブ】
http://2chb.net/r/blog/1554380939/

・ジオシティーズでの失敗から学んだアーカイブにあたっての注意事項
1. 早めに行動しましょう
2. まずは既存のプロジェクトや遺産を探しましょう
3. 単独ではなく組織的に動きましょう
4. 呼びかけや情報共有を積極的に行いましょう

2192.168.0.7742019/04/06(土) 21:44:40.44ID:ToHayX3A0

いちおつ

3192.168.0.7742019/04/06(土) 22:53:39.40ID:khb0d4nX0

>>1 乙です

4192.168.0.7742019/04/06(土) 22:57:35.43ID:C58mCeVw0

なんか、良く解ってない奴がスレ立てた感がもりもり

5192.168.0.7742019/04/06(土) 23:08:18.32ID:W+Cd7+OG0

随分ふんわりとした否定だな

6192.168.0.7742019/04/07(日) 00:26:33.03ID:8q7+ly+v0

スレ立てする時に5chの使い方と日本語以外に解ってなきゃいけないことがあるなんて初めて聞いた

7192.168.0.7742019/04/07(日) 06:32:56.08ID:rvx0PlzU0

サービスの使い方、お知らせなど
日経トレンディネットは3月31日に更新終了、日経クロストレンドへ統合します
https://trendy.nikkeibp.co.jp/atcl/manual/15/1048699/022200013/
2019年03月01日
既存の「日経トレンディネット」の記事は、4月以降、順次閲覧ができなくなり、6月30日にはすべての記事の閲覧ができなくなります（一部は「日経クロストレンド」で閲覧可能です）。
長い間のご利用、ありがとうございました。

8192.168.0.7742019/04/07(日) 06:55:45.40ID:rvx0PlzU0

2019年8月15日(木) niconareサービス終了について
https://blog.nicovideo.jp/niconews/104611.html

4月11日（木）投稿者向けのデータダウンロード機能の提供

投稿者の方がご自身の投稿いただいたスライドや、
スライドについたコメントをダウンロードできる機能を提供いたします。

この機能はniconareのサービス終了日までご利用いただくことができます。

7月18日（木）スライドの投稿、およびコメント投稿機能の提供終了

これ以降はスライドの視聴および、
投稿済みスライド情報の編集のみ行うことができます。

9192.168.0.7742019/04/07(日) 06:58:08.86ID:rvx0PlzU0

今後、はてなグラフ、ポケットはてななど、複数のサービスの提供を終了する予定です
http://hatena.g.hatena.ne.jp/hatena/20180911/1536650034

終了予定
はてなグラフ ( http://graph.hatena.ne.jp )
はてな認証 ( http://auth.hatena.ne.jp )
はてな検索 ( http://search.hatena.ne.jp )
はてなMobileGateWay ( http://mgw.hatena.ne.jp )
ポケットはてな ( http://mobile.hatena.ne.jp)
各サービスのフィーチャーフォン向けの機能・サポート
はてなキーワードAPI ( http://developer.hatena.ne.jp/ja/documents/keyword )
はてなメッセージAPI ( http://developer.hatena.ne.jp/ja/documents/message )
はてなポイント送信機能

10192.168.0.7742019/04/07(日) 07:11:15.82ID:4ZacPRRJ0

最近は本当にサービス終了多いな・・・

11192.168.0.7742019/04/07(日) 07:32:13.57ID:rvx0PlzU0

https://www.cabling-ol.net/cabledirect/news/news190401-1.php
ケーブルダイレクトおよびケーブリングオンラインの各Webサイトの閉鎖日時が決まりましたのでお知らせいたします。　　
ケーブルダイレクトおよびケーブリングオンラインの各Webサイトは、２０１９年５月３１日（金曜日）の午後１２時をもって閉鎖することとさせていただきますので、お知らせいたします。

12192.168.0.7742019/04/07(日) 07:37:42.65ID:rvx0PlzU0

Adobe Flashのサポート終了まであと2年。消えゆくFlashゲームを保存する「Flashpoint」の登録作品がリリースから1年で1万タイトルを超える
https://news.denfaminicogamer.jp/news/181225g

歴史の中に消えようとするデジタルコンテンツを収集し保存するボランティア団体「Archive Team」に所属するBen Latimore氏が、終焉の危機にひんしているFlashゲームを収集し、誰もがプレイできるプラットフォーム「Flashpoint」を公開してから1年が経つ。

13192.168.0.7742019/04/07(日) 07:40:18.59ID:rvx0PlzU0

パブー閉店に伴うブクログからのお知らせ
http://info.booklog.jp/?eid=1007

【パブー・サービス終了までのスケジュール】
2019年6月30日（日）パブー新規作品の作成・公開の停止、プロ版サービス終了、新規会員登録停止
2019年9月30日（月）パブー閉店（商品販売の終了）
2019年10月1日（火）ブクログでのパブー検索終了
2019年11月30日（土）パブー側のログイン機能の停止
2019年12月1日（日）ブクログ本棚のパブー発行書籍の書影の非表示化

14192.168.0.7742019/04/07(日) 07:48:48.33ID:kQbvec6m0

>>10

儲からないからね

15192.168.0.7742019/04/07(日) 09:57:35.03ID:4ZacPRRJ0

とりあえずニコナレ1ページ保存してみたけどやっぱ動的？なサイトだとそう簡単には動いてくれないな
https://web.archive.org/web/20190407004022/https://niconare.nicovideo.jp/watch/kn4316
専門的な知識無いからわかんないや

>>14
情報集めといて一気に消滅させるのやめてほしいわ・・・
結局どのサイトも最終的には消えて無くなるんだろうけどさ

16192.168.0.7742019/04/07(日) 10:38:53.84ID:8q7+ly+v0

【魚拓】とか【Internet Archive】とかスレタイに付けないと検索にひっかからなさそうな気がするわ
立て直した方が良いんじゃないの？

17192.168.0.7742019/04/07(日) 10:55:17.23ID:rvx0PlzU0

Janne Da Arc オフィシャルファンクラブ「マドモアゼルなあなた達」会員の皆様へ
Janne Da Arc解散に伴うファンクラブ解体のお知らせ
https://fanclub.janne.co.jp/

18192.168.0.7742019/04/07(日) 11:20:57.88ID:rvx0PlzU0

【サイト閉鎖のお知らせ】睡眠情報メディア・フミナーズ
https://fuminners.jp/journal/entertainment/16241/

睡眠情報メディア・フミナーズは、2019年3月末日をもって全ての記事の更新をストップし、準備が整い次第、サイトを閉鎖することとなりました。

19192.168.0.7742019/04/07(日) 12:11:36.84ID:ddJkY//e0

おまんこ

20192.168.0.7742019/04/07(日) 13:56:52.92ID:PI3RUhLx0

【意図しないデータ消失事故にアーカイブが活かされた事例】

・2019年3月18日
2003年にサービスを開始して以来、2億人以上のユーザー数を誇っていた米音楽系SNS「Myspace」が、
過去12年間に投稿された写真、動画、音声の全てのファイルをサーバー移行失敗により消失したと発表。

これにより1400万組のアーティストによる5000万以上も楽曲が損失したこととなり、世界各地では亡くなった友人や家族との思い出が消えてしまったなどという悲痛の声があがった。

・2019年4月1日
インターネット・アーカイブが「MySpaceが消失した音楽ファイルのうち、約50万曲が匿名の学術グループによって提供された」と発表し、そのファイルを公開した。
喪失した音楽ファイル全体の1％にも満たない曲数ではあるが、復旧したデータ量は1.3TBにも及ぶ。
今後の第三者によるデータ提供に注目が集まっている。

Myspaceの喪失データのうち約50万件の音楽ファイルが学術グループにより復活
https://gigazine.net/news/20190405-recover-half-million-myspace-songs/

21192.168.0.7742019/04/07(日) 14:30:36.57ID:rvx0PlzU0

2019.02.26　サービス終了のお知らせ
http://www.mapfan.net/news/index.html#190226

平素は「MapFan.net」をご愛顧頂きまして、誠にありがとうございます。

「MapFan.net」は、2020年3月31日をもちましてサービス終了させて頂きます。
ユーザーの皆様には大変ご迷惑をおかけ致しますが、何卒ご理解賜りますようお願い申し上げます。

サービス終了に伴い、2019年2月26日時点で「通常版」*1をご利用中のユーザー様につきましては、有効期限を2020年3月31日まで延長させて頂きました。
サービス終了までご利用頂けますので、継続利用手続きの必要はございません。
なお、新規購入につきましては、サービス終了する1年前の2019年3月31日をもちまして、お手続きを停止致しました。

また、「MapFan.net」は終了致しますが、今後は、MapFanプレミアム会員向けサービス *2の中で、パソコン用地図ソフトをご利用いただけるよう準備しております（2019年度中予定）。

22192.168.0.7742019/04/07(日) 14:38:15.11ID:rvx0PlzU0

全サービス終了のお知らせ｜ DNSを自由に簡単に。Dozens（ダズンズ）
https://dozens.jp/close/

サービス終了までのスケジュール
・2019年3月1日（金）
新規会員登録・有料プランへのアップグレード受付終了
・2019年9月30日（月）
コントロールパネル・APIの停止
・2019年10月31日（木）
DNSサーバーの停止・サービスの完全終了

23192.168.0.7742019/04/07(日) 17:43:24.63ID:FMiv5iU/0

>>16

同意する

24192.168.0.7742019/04/07(日) 18:13:55.69ID:PI3RUhLx0

色々なサイトの情報が集まってきているからwikiとかがあった方がいいかもね

25192.168.0.7742019/04/07(日) 20:26:45.76ID:8q7+ly+v0

【Internet Archive】ウェブアーカイブ総合 Page.01【ウェブ魚拓】
のスレタイで立て直すけどいい?

26192.168.0.7742019/04/07(日) 20:39:47.53ID:R6TrddMD0

【魚拓】ウェブアーカイブ総合 Page.01【Internet Archive】
こっちのほうが見やすいかも

27192.168.0.7742019/04/07(日) 20:41:13.58ID:8q7+ly+v0

>>26
そっちの方がいいね

28192.168.0.7742019/04/07(日) 21:03:08.45ID:5OnOP9Lv0

テンプレのURL中のカンマも何とかしろよ
要らんものにも付いてるし、大文字を使うだけで回避できるのもある

29192.168.0.7742019/04/07(日) 21:21:30.37ID:PI3RUhLx0

archive.today は https じゃなくて httpだぞ

30192.168.0.7742019/04/07(日) 21:22:54.38ID:PI3RUhLx0

これでも回避できるかな
http://archive%2efo/
http://archive%2eis/
http://archive%2etoday/

31192.168.0.7742019/04/07(日) 21:47:48.30ID:8q7+ly+v0

これでいいかな

ウェブアーカイブ関連の話題を総合的に扱うスレです。
情報交換し合って貴重なインターネット遺産を後世に残しましょう。
Internet ArchiveなどのWebサービスだけでなく、wget・HTTrack・Heritrix等のツールやソフト、自作クローラの話題もOKです。

・関連リンク（Rock54回避のためピリオドをカンマに変更）
Wayback Machine
https://archive.org/
archive is
http://archive%2eis/
ウェブ魚拓
https://megalodon.jp/
Archive Team
https://archiveteam.org/

・関連スレ
Internet Archive総合 (web.archive.org) #2
http://2chb.net/r/esite/1475246713/
ウェブ魚拓 Part3
http://2chb.net/r/esite/1498902308/
【和塩】geocitiesスレ10【ジオシティーズ】
http://2chb.net/r/hosting/1554115546/
【ヤフー】Yahoo!ブログ【アーカイブ】
http://2chb.net/r/blog/1554380939/

・ジオシティーズでの失敗から学んだアーカイブにあたっての注意事項
1. 早めに行動しましょう
2. まずは既存のプロジェクトや遺産を探しましょう
3. 単独ではなく組織的に動きましょう
4. 呼びかけや情報共有を積極的に行いましょう

32192.168.0.7742019/04/07(日) 21:55:01.17ID:PI3RUhLx0

（Rock54回避のためピリオドをカンマに変更）が消えてないよ

33192.168.0.7742019/04/07(日) 22:01:00.95ID:8q7+ly+v0

【魚拓】ウェブアーカイブ総合 Page.01【Internet Archive】

ウェブアーカイブ関連の話題を総合的に扱うスレです。
情報交換し合って貴重なインターネット遺産を後世に残しましょう。
Internet ArchiveなどのWebサービスだけでなく、wget・HTTrack・Heritrix等のツールやソフト、自作クローラの話題もOKです。

・関連リンク
Wayback Machine
https://archive.org/
archive is
http://archive%2eis/
ウェブ魚拓
https://megalodon.jp/
Archive Team
https://archiveteam.org/

・関連スレ
Internet Archive総合 (web.archive.org) #2
http://2chb.net/r/esite/1475246713/
ウェブ魚拓 Part3
http://2chb.net/r/esite/1498902308/
【和塩】geocitiesスレ10【ジオシティーズ】
http://2chb.net/r/hosting/1554115546/
【ヤフー】Yahoo!ブログ【アーカイブ】
http://2chb.net/r/blog/1554380939/

・ジオシティーズでの失敗から学んだアーカイブにあたっての注意事項
1. 早めに行動しましょう
2. まずは既存のプロジェクトや遺産を探しましょう
3. 単独ではなく組織的に動きましょう
4. 呼びかけや情報共有を積極的に行いましょう

34192.168.0.7742019/04/07(日) 22:15:14.47ID:5OnOP9Lv0

http://Archive.is/

35192.168.0.7742019/04/07(日) 22:22:56.39ID:8q7+ly+v0

>>33-34でスレ立てるけど良いよね？

36192.168.0.7742019/04/07(日) 22:37:00.78ID:PI3RUhLx0

テンプレ3つと比較したら圧倒的に認知されてないけど一応この2つのアーカイブサイトもある

WebCite
https://www.webcitation.org/archive
Archive.st
http://archive.st

37192.168.0.7742019/04/07(日) 23:14:50.73ID:8q7+ly+v0

>>36
これも追加しておくわ

38192.168.0.7742019/04/08(月) 00:10:23.59ID:csp1RLRO0

これ以上意見なさそうなんで立て直してくる

39192.168.0.7742019/04/08(月) 00:16:32.72ID:csp1RLRO0

本文はこれにする
ただスレタイの文字数制限に引っ掛かってしまったんでどこか削らないと駄目だな

ウェブアーカイブ関連の話題を総合的に扱うスレです。
情報交換し合って貴重なインターネット遺産を後世に残しましょう。
Internet ArchiveなどのWebサービスだけでなく、wget・HTTrack・Heritrix等のツールやソフト、自作クローラの話題もOKです。

・関連リンク
Wayback Machine
https://archive.org/
archive is
http://Archive.is/
ウェブ魚拓
https://megalodon.jp/
WebCite
https://www.webcitation.org/archive
Archive.st
http://archive.st
Archive Team
https://archiveteam.org/

・関連スレ
Internet Archive総合 (web.archive.org) #2
http://2chb.net/r/esite/1475246713/
ウェブ魚拓 Part3
http://2chb.net/r/esite/1498902308/
【和塩】geocitiesスレ10【ジオシティーズ】
http://2chb.net/r/hosting/1554115546/
【ヤフー】Yahoo!ブログ【アーカイブ】
http://2chb.net/r/blog/1554380939/

・ジオシティーズでの失敗から学んだアーカイブにあたっての注意事項
1. 早めに行動しましょう
2. まずは既存のプロジェクトや遺産を探しましょう
3. 単独ではなく組織的に動きましょう
4. 呼びかけや情報共有を積極的に行いましょう

40192.168.0.7742019/04/08(月) 00:34:32.72ID:kFS6Xl/I0

ジオシティーズ消える前に立てないあほ

41192.168.0.7742019/04/08(月) 00:43:05.43ID:csp1RLRO0

>>40
ジオシティーズスレでのアーカイブ活動の振り返りから生まれたスレらしいのでそれはそう

スレタイだけど、これならインターネット板の制限に収まるはずこれで良いよね
ウェブアーカイブ総合【Internet Archive・魚拓】#1

42192.168.0.7742019/04/08(月) 00:45:54.81ID:HokS2hQ10

archive.st はいらんでしょ

43192.168.0.7742019/04/08(月) 00:50:15.61ID:HokS2hQ10

【魚拓】ウェブアーカイブ総合1【Internet Archive】
スレタイこれでもいける

44192.168.0.7742019/04/08(月) 00:54:42.68ID:csp1RLRO0

>>43
この板のスレタイ制限は48バイトなんだが、それは50バイトだからオーバーしてしまう

45192.168.0.7742019/04/08(月) 01:04:44.88ID:csp1RLRO0

>>42
あっても良いんじゃない

46192.168.0.7742019/04/08(月) 02:17:39.24ID:Lv11LAhu0

パート数増える事考えると少し余裕もたせたいね

47192.168.0.7742019/04/08(月) 04:47:52.01ID:Lv11LAhu0

魚拓諦めてIAだけのほうがいいのかな
【InternetArchive】ウェブアーカイブ総合 Page.1
いっそ文字数制限の緩和を申請してみるのもいいかもしれない

48192.168.0.7742019/04/08(月) 06:12:04.28ID:1L4c/w+i0

>>24

あー、そうだな。

誰かにウィキ作ってほしい。

49192.168.0.7742019/04/08(月) 08:07:46.10ID:1ZNe+OlH0

wikiはみんなで作るものだぞ

50192.168.0.7742019/04/08(月) 09:29:10.99ID:kuGZ5jM70

共同編集サイトで有名なのってwiki以外だとgoogleドキュメントくらいか
他に候補ある？

51192.168.0.7742019/04/08(月) 09:37:42.02ID:csp1RLRO0

>>47
文字数制限緩和の申請は賛成だけど、どれくらい待たされるか分からん(そもそも許可されないかも)し、とりあえず>>48のスレタイで立てるよ

52192.168.0.7742019/04/08(月) 09:38:41.30ID:csp1RLRO0

>>48じゃなくて>>41だった

53192.168.0.7742019/04/08(月) 09:41:17.79ID:kuGZ5jM70

【ウェブ魚拓】インターネットアーカイブ総合 #1

一つの案として。

54192.168.0.7742019/04/08(月) 09:44:44.34ID:Lv11LAhu0

立て直す前にwiki作っとかない？
どうせならもうテンプレに突っ込んどいちゃったほうがいいと思うんだけど

55192.168.0.7742019/04/08(月) 13:23:24.39ID:Gn50FMSd0

>>49

最初の設定は誰かが単独で行うだろ。

56192.168.0.7742019/04/08(月) 13:23:40.54ID:Gn50FMSd0

>>54

同意

57192.168.0.7742019/04/08(月) 13:25:37.41ID:Gn50FMSd0

>>1

> Archive Team
> https://archiveteam.org/

これは知らなかった。

58192.168.0.7742019/04/08(月) 13:54:47.88ID:csp1RLRO0

>>53
Internet Archiveのスレと間違われそう

誰かwikiの管理をできる時間がある人がいたらwiki作成宜しく
自分は管理者業務とか無理だわ

59192.168.0.7742019/04/08(月) 14:42:32.50ID:kuGZ5jM70

どこか既存のwikiに専用のページを作るっていう方法もある
アーカイブ関係のwikiがすでにあればそういうところがいいんだけど

60192.168.0.7742019/04/08(月) 17:21:50.82ID:7Gb6dlTw0

一分に一件ずつ保存しても一日1440頁しか保存できない。

61192.168.0.7742019/04/08(月) 18:46:46.19ID:csp1RLRO0

これで立てようとしたけどホスト規制に引っ掛かってしまったので誰か頼んだ

タイトル：ウェブアーカイブ総合【Internet Archive・魚拓】#1
内容：
ウェブアーカイブ関連の話題を総合的に扱うスレです。
情報交換し合って貴重なインターネット遺産を後世に残しましょう。
Internet ArchiveなどのWebサービスだけでなく、wget・HTTrack・Heritrix等のツールやソフト、自作クローラの話題もOKです。

・関連リンク
Wayback Machine
https://archive.org/
archive is
http://Archive.is/
ウェブ魚拓
https://megalodon.jp/
WebCite
https://www.webcitation.org/archive
Archive.st
http://archive.st
Archive Team
https://archiveteam.org/

・関連スレ
Internet Archive総合 (web.archive.org) #2
http://2chb.net/r/esite/1475246713/
ウェブ魚拓 Part3
http://2chb.net/r/esite/1498902308/
【和塩】geocitiesスレ10【ジオシティーズ】
http://2chb.net/r/hosting/1554115546/
【ヤフー】Yahoo!ブログ【アーカイブ】
http://2chb.net/r/blog/1554380939/

・ジオシティーズの件から学んだアーカイブにあたっての注意事項
1. 早めに行動しましょう
2. まずは既存のプロジェクトや遺産を探しましょう
3. 単独ではなく組織的に動きましょう
4. 呼びかけや情報共有を積極的に行いましょう

・旧スレ
http://2chb.net/r/internet/1554553882

62192.168.0.7742019/04/08(月) 20:23:02.60ID:IXy1N+9U0

正直そんなに慌てて次スレ建てなくてもいい
このスレでwikiの作成や話し合いを十分にやってから立てればいい

63192.168.0.7742019/04/08(月) 21:41:07.95ID:csp1RLRO0

それもそうか
Wiki作るって言っても無計画にやったら瓦解するだろうし、具体的に何を書く（書いていい）Wikiなのか決めとかないと

64192.168.0.7742019/04/08(月) 23:09:47.96ID:73UxGWOW0

規律と理念、主要なアーカイブサイトのアーカイブリクエスト方法と見方、主要なツールの使い方、アーカイブに便利なソフトウェア一覧、関連リンク集、サービス終了が告知されている中で保存に公益性がありそうなサイト一覧、将来的に保存が必要になりそうなサイト一覧
とか？
多少ArchiveTeamに倣ったほうがよさそう

65192.168.0.7742019/04/09(火) 00:37:25.02ID:qC7dF5bK0

他力本願で技術力が足りない人が多すぎるから、人を集めることも重要だな

66192.168.0.7742019/04/09(火) 01:27:21.91ID:vAsLhlqU0

【12日まで】500円を貰える春のばらまきキャンペーン開催中です　　　　　

① スマホのApp Storeから「プリン(pring)」をインストールする　　
② 会員登録を済ませる　　　　
③ 下図の通りに進む　　　　
【保存・記録】ウェブアーカイブ総合 Page.01 ニコニコ動画>1本 ->画像>14枚

　
④ コードを登録 [5gAYSz]　　
　　　　
これで五百円を貰えます　　
スマホでセブンATMからお金を下ろせたり便利なアプリですので是非お試し下さい。　　　

67192.168.0.7742019/04/09(火) 02:14:18.12ID:Xrq4p9iW0

結局wikiはどこに作るんだ
atwikiかwikiwiki辺りか？

68192.168.0.7742019/04/09(火) 06:11:46.94ID:bDBZAOBP0

>>67

その二択なのか？

69192.168.0.7742019/04/09(火) 07:35:20.06ID:aX1j4Hrw0

MediaWiki 一択でしょ

70192.168.0.7742019/04/09(火) 07:42:31.88ID:aX1j4Hrw0

>>64
というか ArchiveTeam の日本語版を作ったほうがいいな
向こうが全てにおいて優れているから自分達で１から始める理由がない
日本支部的な感じで翻訳から始めよう

71192.168.0.7742019/04/09(火) 10:44:41.80ID:47CWuxog0

そのまま日本語化は無理だろうね、法律違うし
アーカイブをまとめてtorrentで配布とかそもそもサイトをアーカイブして勝手に公開することとか
禁止しないといけないこと、解釈を変えないといけないこと色々あるでしょう

72192.168.0.7742019/04/09(火) 12:18:20.83ID:j/bARIBT0

Torrent配布は日本では完全に無理だな
Archive Teamはインターネットアーカイブをデータを提供しているらしいから、それに倣った方がいい

73192.168.0.7742019/04/09(火) 17:30:25.36ID:ilhSCREf0

そういえば少し前にググルマップがゼンリン切ったけど、ゼンリンが提供してた部分以外で何か独自の消失したものってあった？

74192.168.0.7742019/04/09(火) 20:25:46.98ID:R0ew9YH30

このスレってパソコン初心者感がすごいな
このまま進んでも上手くいかないだろうな、というのが見てて分かる

75192.168.0.7742019/04/09(火) 20:40:23.16ID:TX2XtJeD0

随分ふんわりとした否定だな

76192.168.0.7742019/04/09(火) 21:42:02.72ID:j/bARIBT0

初心者っぽいポイントを挙げてみろよ
出来ないならそれは単にイチャモン付けてるだけだぞ

77192.168.0.7742019/04/09(火) 21:51:39.41ID:j/bARIBT0

×初心者っぽいポイント
○上手くいかないであろう根拠

逆に聞くが>>74はどうやったら上手くいくと思うよ？

78192.168.0.7742019/04/09(火) 22:06:36.56ID:Ybc45mGn0

適当に作ったブックマークレット各種
google cache化
javascript:{window.open('http://webcache.googleusercontent.com/search?q=cache:'+escape(window.location.href.replace(/^https?:\/\//,''))+'');eval();}

保存 WayBackMachine (web.archive.org)
javascript:{window.open('https://web.archive.org/save/'+escape(window.location.href.replace(/^https?:\/\//,'')).replace('http://','')+'');eval();}

WayBackMachine最新
javascript:{window.open('https://web.archive.org/web/submit/?url='+escape(window.location.href.replace(/^https?:\/\//,'')).replace('http://','')+'&type=replay');eval();}

GeoLog化
javascript:{window.open('https://thaliana.mydns.jp/GeoLog/'+escape(window.location.href.replace(/^https?:\/\//,'')).replace('http://','')+'');eval();}

79192.168.0.7742019/04/09(火) 22:34:51.34ID:Ybc45mGn0

適当に作ったブックマークレット各種(2)
Save to Archive.today
javascript:void(open('http://archive.today/?run=1&;url='+encodeURIComponent(document.location)))

Web魚拓化
javascript:{window.open('http://gyo.tc/'+escape(window.location.href.replace(/^https?:\/\//,''))+'');eval();}

80192.168.0.7742019/04/09(火) 23:12:16.41ID:thZOPaUB0

グッジョブ

81192.168.0.7742019/04/10(水) 14:33:20.20ID:0KzfqGnC0

>>78
google cacheをWayBackMachineに保存するときに保存のブックマークレット使うと失敗しますね。
最新の方で開いてから「Save this url in the Wayback Machine」をクリックで成功。
一度失敗してしまった場合はgoogle cacheのURLの後ろに「&hl=ja」等をつけてから最新で開いて「Save This URL」。

82192.168.0.7742019/04/10(水) 15:33:03.08ID:y92qvzSP0

>>1
INTERNATIONAL INTERNET PRESERVATION CONSORTIUM - IIPC
http://netpreserve.org/

83192.168.0.7742019/04/10(水) 18:38:04.28ID:kmjY19lr0

>>78
Internet Archiveスレから引用

http://2chb.net/r/internet/1554553882/78-79

/save/ を知ってて /web/2/ を知らないとは。
あと保存の際に http:// や https:// を無条件に外すのも考え物。
HTTP から HTTPS へリダイレクトするサイトだと、そのリダイレクトも
保存回数に計上されてしまう。

84192.168.0.7742019/04/10(水) 22:12:15.15ID:5UKQiW/z0

/web/2/ってのは/web/*/の勘違いかタイポなんだろうな
/web/*/使えばもっと簡潔に書けると思うよ

85192.168.0.7742019/04/10(水) 22:14:34.68ID:Qi/9tnuY0

/web/*/だと一覧に飛んで/web/2/だと最新のに飛ぶんでないの

86192.168.0.7742019/04/10(水) 23:12:54.50ID:0KzfqGnC0

保存 WayBackMachine (web.archive.org)
javascript:{window.open('https://web.archive.org/save/'+escape(window.location.href+''));eval();}

WayBackMachine最新
javascript:{window.open('https://web.archive.org/web/2/'+escape(window.location.href+''));eval();}

87192.168.0.7742019/04/11(木) 00:46:30.73ID:2s+xSUEt0

/web/URLでも最新に飛べるけどな

88192.168.0.7742019/04/11(木) 10:08:33.22ID:NcP8kiVw0

このスレ見つけらんねえよ
魚拓,archive,waybackとかスレタイに含まれてなきゃ

89192.168.0.7742019/04/11(木) 10:41:01.74ID:zpHmesQE0

上の方で話してたけどスレタイの文字数制限厳し目だからウェブアーカイブ総合の横にInternetArchiveと魚拓入れただけでカツカツになっちゃうんだよね
板設定変更依頼スレッド見ると簡単には設定変更してくれないようだしなんか削らないと
いっそ魚拓・InternetArchive総合にすりゃいいのか？

90192.168.0.7742019/04/11(木) 11:12:44.61ID:JiNXg/cV0

良スレだな。応援してるわ
日本のサイトもサービス終了対策しないと空白になってしまうので
管理人が全員生きてて引っ越し出来るとも限らんし、消された情報が将来誰かに必要・不要なんて分からんのよね

日本の法律から、終了するサイトは丸ごと個人のローカルへ保存する方法が有ると良いな
分散バックアップにもなると思う

91192.168.0.7742019/04/11(木) 11:26:31.44ID:3yDWyDnm0

>>89
タイトル案

【魚拓】ウェブアーカイブ1【Internet Archive】
【魚拓】ウェブアーカイブ1【InternetArchive】
【魚拓】ウェブアーカイブ1【IA】
【魚拓】ｳｪﾌﾞｱｰｶｲﾌﾞ1【Internet Archive】
【魚拓】アーカイブ1【Internet Archive】
【魚拓】Web archiving1【Internet Archive】
魚拓：ウェブアーカイブ1：Internet Archive
ウェブアーカイブ1【Wayback Machine,魚拓】
ウェブアーカイブ1【Internet Archive,魚拓】
ウェブアーカイブ1【魚拓】
ウェブアーカイブ1😂InternetArchive魚拓
ウェブアーカイブInternetArchive魚拓1
archive 1【魚拓】
魚拓 1

92192.168.0.7742019/04/11(木) 12:00:59.64ID:aWNM129m0

魚拓やWayback Machine以外のツールも扱うよ、ってことで「総合」は付けておきたい

93192.168.0.7742019/04/11(木) 12:04:19.18ID:aWNM129m0

>>91
追加

ウェブアーカイブ総合【Internet Archive・魚拓】#1
【ウェブ魚拓】インターネットアーカイブ総合 #1

>>1にリンクがあるウェブ魚拓スレやIA専用スレと間違われないようなスレタイが望ましい

94192.168.0.7742019/04/11(木) 12:18:42.95ID:zpHmesQE0

となるとやっぱりウェブアーカイブ総合は外せないか？
魚拓、InternetArchiveの他にウェブページを保存したい人が調べそうな単語ってあるんかな
収集、保存、保管、ダウンロード、キャプチャ、スクラップ
うーん・・・

95192.168.0.7742019/04/11(木) 12:26:06.26ID:D+Yqkgbv0

魚拓もウェブ魚拓って完全にスレタイに含めないと話にならない

96192.168.0.7742019/04/11(木) 13:18:54.90ID:aWNM129m0

ウェブ魚拓は固有名詞としても使うだろ
https://info.5ch.net/index.php/魚拓
このサイトでも「魚拓」とだけ紹介してるし、何よりスレタイ制限の48バイトって結構カツカツだし、魚拓だけで良いんじゃないかな

97192.168.0.7742019/04/11(木) 13:20:20.32ID:aWNM129m0

>>96
×魚拓だけで良いんじゃないかな
○「ウェブ魚拓」と完全にスレタイに含める必要は無いんじゃないかな

98192.168.0.7742019/04/11(木) 13:59:00.00ID:D+Yqkgbv0

そんなにこだわってないならIAは略していいってことになるけどそうはならないのと同じ
ウェブ魚拓とスレタイに含めないと立てる意味がない

99192.168.0.7742019/04/11(木) 14:44:54.16ID:zpHmesQE0

【ウェブ魚拓】ウェブアーカイブ総合 Page.1【InternetArchive】
sjisで60バイト
ウェブ魚拓をweb魚拓にすれば57バイト
ウェブアーカイブもwebアーカイブにすれば54バイト
64バイトまで引き上げてもらえば全部入る
【ウェブ魚拓】を抜けば48バイトに収まる
とりあえずウェブ魚拓抜いて立て直して申請通ったら次のスレからウェブ魚拓も入れるのがいいんじゃないか
なぜIAじゃなくてウェブ魚拓を抜くのかについてはGoogleの検索トレンドを参考にした
【保存・記録】ウェブアーカイブ総合 Page.01 ニコニコ動画>1本 ->画像>14枚

100192.168.0.7742019/04/11(木) 15:23:27.94ID:rHrFPNjW0

大抵「Archive」でスレタイ検索するなあ自分は

101192.168.0.7742019/04/11(木) 16:54:04.85ID:aWNM129m0

「ウェブ魚拓」と「魚拓」のどちらでも、Googleなら上手いこと検索に引っ掛かってくれそうではある
Bingは知らん

102192.168.0.7742019/04/11(木) 18:36:21.34ID:3yDWyDnm0

「魚拓」でも引っかかるから「ウェブ」は要らないね
https://www.google.com/search?q=%E9%AD%9A%E6%8B%93+site%3A5ch.net

というか普通にスレあった
http://2chb.net/r/esite/1498902308

>>92
「ウェブアーカイブ」だけで全てを説明できてるから「総合」も要らないと思う
Internet Archive, Wayback Machine, archive.is, 魚拓, ArchiveTeam は全部「ウェブアーカイブ」で説明できる 👀
Rock54: Caution(BBR-MD5:1322b9cf791dd10729e510ca36a73322)

103192.168.0.7742019/04/11(木) 18:59:21.43ID:zpHmesQE0

ウェブアーカイブ（に関するものを）総合（したスレッド）
ていうかそれ総合格闘技とか格闘技で空手やら柔道やら説明できるから総合いらないじゃんって言ってるようなもんでしょ
総合とわざわざ表記することによって一つではなく全体であることを暗に示してるんだよ

104192.168.0.7742019/04/11(木) 19:37:27.64ID:3yDWyDnm0

いや、どっちかというと「空手 part1」でも十分なのに「空手総合 part1」にしてる感じ
ウェブアーカイブの技術としては１つにまとまるから総合しなくてもいい
「ウェブアーカイブサービス総合」なら自然だね
文字列制限があるなら省いても問題ない

105192.168.0.7742019/04/11(木) 19:55:40.33ID:3yDWyDnm0

今気づいたけど「ウェブアーカイブ」が何を指すかの認識の違いだね

①　ウェブアーカイブ → アーカイブのサービス (digital archive or archive site)
②　ウェブアーカイブ → アーカイブ技術 (web archive or web archiving)

アーカイブ技術という意味で使っても良いかと思う

106192.168.0.7742019/04/11(木) 23:09:34.96ID:L2Qvrxob0

>>78-79
window.open()の後ろにeval()付けたり、void()の引数にしたり、
未定義値を返したいだけなのに方法がバラバラ。
同じ人が作ったにしては変な話だな。

107192.168.0.7742019/04/12(金) 00:06:00.46ID:dU8Shh4A0

公式が公開しているものをコピペしたのも含まれてるのかな

108192.168.0.7742019/04/12(金) 03:12:04.19ID:IEOgrIFJ0

todayは公式のやつだったかも。てへぺろｯ

109192.168.0.7742019/04/12(金) 07:27:14.62ID:SClfSpUI0

67 名前：192.168.0.774
投稿日：2019/04/09(火) 02:14:18.12 ID:Xrq4p9iW0
結局wikiはどこに作るんだ
atwikiかwikiwiki辺りか？

69 名前：192.168.0.774
投稿日：2019/04/09(火) 07:35:20.06 ID:aX1j4Hrw0
MediaWiki 一択でしょ

↑

まずここから考えよう

110192.168.0.7742019/04/12(金) 07:30:12.18ID:SClfSpUI0

シーサーブログのシーサーウィキというのもあるらしいが。

111192.168.0.7742019/04/12(金) 07:35:28.30ID:SClfSpUI0

Wiki3（うぃきさん）
https://twitter.com/wiki_three
https://twitter.com/5chan_nel (5ch newer account)

112192.168.0.7742019/04/12(金) 07:36:46.55ID:SClfSpUI0

Seesaa Wiki（シーサーウィキ）とはシーサー
株式会社が運営するレンタルウィキサービスである。

@wiki（あっとうぃき、atwiki）とは、和歌山県の有限会社アット
フリークスが提供するレンタルウィキ。2ちゃんねる掲示板のパート
スレッド（パートスレ）まとめに用いられることが多い。

（以上ウィキペディアより）

113192.168.0.7742019/04/12(金) 12:28:44.53ID:xJcFOgmj0

MediaWikiはきちんとしたシステムが作れるのはメリットだけど管理が面倒
Pukiwikiはどうだろう
https://pukiwiki.osdn.jp

114192.168.0.7742019/04/12(金) 16:01:45.26ID:U3RvVBMo0

ミクシィもSNSはお荷物事業だからそろそろたたむ準備してそうだな

115192.168.0.7742019/04/12(金) 16:32:28.92ID:zTEegk2Q0

相変わらずパソコン初心者感が満載
おかげさまで、パクりの寄せ集めを「作った」と詐称しても
その不自然さに気付けないという

>>113
この流れだと、セットアップ済みのレンタルWikiの方が無難だと思うよ

116192.168.0.7742019/04/12(金) 17:13:46.28ID:OzOD5/Ux0

高圧的に的確な指示出しててワロタ

117192.168.0.7742019/04/12(金) 19:41:50.36ID:ntUyAAnO0

2年ちょっと前に無くなったniftyの@homeで2TB前後なのか…

https://internet.watch.impress.co.jp/docs/news/751124.html

118192.168.0.7742019/04/12(金) 19:44:52.10ID:IEOgrIFJ0

初心者とかどうでも良い。使えさえすれば。

119192.168.0.7742019/04/12(金) 19:48:37.42ID:3kWgI93v0

今必要なのは初心者じゃないけどな

120192.168.0.7742019/04/12(金) 23:04:13.37ID:6eRxenyu0

使えりゃ何でも良いから不自然だろうが気にしないけどな
使ってて問題がありゃ自分で作り直すまでだ

121192.168.0.7742019/04/12(金) 23:06:32.84ID:6eRxenyu0

>>115
>セットアップ済みのレンタルWikiの方が無難
確かにな、一からサーバ立てて設定しなきゃいけないWikiだと結局グダりそうだ
そうなるとポピュラーなatwikiあたりかな

122192.168.0.7742019/04/13(土) 04:31:44.74ID:PBKRoLHf0

ShoutWiki なら無料で MediaWiki 使えるね
とりあえず有能な人が来るまではこれでいいでしょ

123192.168.0.7742019/04/13(土) 05:50:27.39ID:oa76VPkq0

>>122

それで異存はない。

124192.168.0.7742019/04/13(土) 10:15:26.73ID:ybhQs0Es0

そしてwikiサービス終了するんですね分かります

125192.168.0.7742019/04/13(土) 14:37:20.47ID:BP9fC9wY0

終了したらどこか別のところへ移転すれば良い

126192.168.0.7742019/04/13(土) 17:53:03.37ID:BP9fC9wY0

>>104
「総合」を付けることを発案した者です
単に「ウェブアーカイブ」というとIAやArchive.is等のウェブサービスを使うことを連想している人が多かったようなので、
ウェブアーカイブはそれだけじゃないよ、wget等のツールや自作ソフトを使うのも立派なウェブアーカイブなんだよ、ということを強調したかった
そして、IA専用スレやウェブ魚拓スレで扱われないウェブアーカイブ技術関連の話題の受け皿にしたかった
>>105の言う通り認識にズレがあるみたいだね

127192.168.0.7742019/04/13(土) 19:36:41.35ID:LxikEBfR0

>>126
126名無しさん＠お腹いっぱい。2019/04/06(土) 09:24:43.110
インターネット遺産のアーカイブ系総合スレみたいなところってどこ？
そういうところは5chに無いのかな

総合ってはじめに使い出したのは俺なんだけどな

128192.168.0.7742019/04/13(土) 20:07:13.70ID:HJ17KfG20

>>127
すまん、ここのスレタイを考えたのは自分だったので思い違いをしてた

129192.168.0.7742019/04/13(土) 20:07:54.32ID:HJ17KfG20

ID:BP9fC9wY0です

130192.168.0.7742019/04/14(日) 01:04:52.71ID:CM5+hhVJ0

日本だとウェブアーカイブは著作権侵害（犯罪）になるからこのスレ危ないよね？
逮捕されたくないので消えます

131192.168.0.7742019/04/14(日) 01:25:36.52ID:nTd5PtnI0

実際その辺は心配ではある
弁護士に聞いてもやめとけで終わりそう
個人でDLしての私的利用ならアリなのかな
とりあえずツール中心の紹介にとどめておくべきかもね

132192.168.0.7742019/04/14(日) 02:56:48.93ID:v+D0MDAi0

まだ親告罪だから訴えられなければセーフ

133192.168.0.7742019/04/14(日) 03:08:40.08ID:v+D0MDAi0

ちゃんと説明すると、非親告罪化された著作物は金銭的な利益が絡むものに限られてるので、
大体のウェブアーカイブの場合問答無用で捕まることはないはず（多分）
あと著作権法に抵触するのはウェブアーカイブを無断で公開した場合のみであって、
各個人でサイトを保存して私的に取っておくこと自体は違法でもなんでもない

Archive Team経由でInternet Archiveにデータを寄付してしまえば日本の法律では手が出せないはず

134192.168.0.7742019/04/14(日) 03:17:25.65ID:SqtAvvkZ0

ウェブ魚拓の運営も捕まってないよね

135192.168.0.7742019/04/14(日) 03:26:04.24ID:qw07bbn30

削除依頼無視でもしない限りは大丈夫なんじゃないの
アーカイブしたサイトに違法なコンテンツがあったらどうなるかわからんけど

136192.168.0.7742019/04/14(日) 03:44:40.89ID:v+D0MDAi0

>>134
そうなんだよね
パッと見完全にアウトなサービスだけどちゃんと続いてるってことは、上手くやれば訴訟を起こされるようなことにはならないってことだし
それにあそこの運営は企業だから、事業の一つにもなりうるってことでもある

137192.168.0.7742019/04/15(月) 03:23:24.42ID:zgYzoRmr0

Shoutwikiでサイト立てるのは誰がやる？
暇だったら自分がやってたんだが正直管理業務とかやってる余裕がない

138192.168.0.7742019/04/15(月) 22:12:08.31ID:k4EioB070

いっそ最初はwikiじゃなくて各々が個人サイトとかブログで情報まとめたりしてそれらのサイトをリスト化すればいいんじゃないか

139192.168.0.7742019/04/15(月) 22:26:55.43ID:+QZpIriz0

>>138
全員が個人サイトやらブログやらを持っている訳じゃないし、持ってても手間がかかって面倒だって人間もいるだろう
各々が直接情報を書き込んで行く方が手間がかからない
そうなると、きちんとした体制さえ構築できるのならWikiが一番良い

140192.168.0.7742019/04/15(月) 22:40:37.04ID:k4EioB070

それはわかってるけどwikiを管理する技術と時間がある人いるのかって話なんすわ・・・

141192.168.0.7742019/04/15(月) 23:09:48.42ID:OIWksCm90

wikiが必要なほどの量の情報が集まるのかが疑問
アーカイブに関することと言ってもツールの使い方を翻訳するくらいしかできないだろう

本格的なアーカイブ作業をするのならArchiveTeamに入るべき
日本支部を作るにしても結局はArchiveTeam本部の力が必要

日本のサイトは英語圏から見逃されやすいから日本人の注目を集めることでArchiveTeamに貢献することもできるかもしれない
ただし本当に技術がある人は既に英語圏のコミュニティに参加しているからどれほど効果があるかは分からない

142192.168.0.7742019/04/15(月) 23:10:03.44ID:+QZpIriz0

それは確かになぁ
正直>>115がやれば良いんじゃないかという感じがする

143192.168.0.7742019/04/15(月) 23:17:05.99ID:+QZpIriz0

ArchiveTeamって多くの日本人は入りづらい所があると思うんだ
だからArchiveTeam本部と一般の日本人ネットユーザーの架け橋になるような組織はあって損はないと思う
ArchiveTeamのサイトにはアーカイブについての知見がまとめられているから、MediaWikiなんて大仰なものが必要かは疑問ではあるけど、
彼らの知見を翻訳して日本人向けに公開する場所はそれなりに有意義じゃないだろうか

144192.168.0.7742019/04/15(月) 23:19:08.03ID:d2BbUiX90

とりあえず最初はgoogleドキュメントみたいな手軽なところでやってみれば

145192.168.0.7742019/04/15(月) 23:20:08.99ID:+QZpIriz0

日本でウェブアーカイブというと既存のウェブサービスを利用するイメージが強いからね
英語コミュニティで活動する日本人エンジニアはある程度いるが、そうした人の中でもウェブアーカイブについて詳しい人はそんなにいないと思うよ

146192.168.0.7742019/04/17(水) 12:15:06.93ID:KC94xqUc0

英語コミュニティで活動する日本人エンジニアで、ウェブアーカイブについて詳しい人は結構いると思うが
ウェブアーカイブに関する活動に多くのリソースを使おうと考える人は非常に少ないだろうね

147192.168.0.7742019/04/17(水) 13:25:55.62ID:pBKnwE2u0

ウェブアーカイブ専門の日本人は、国内コミュニティ・英語コミュニティ問わずかなり少ない
機械学習用のデータ収集やWebサービスの構築などの目的で、クローラを動かしてスクレイピングすることはエンジニアの間でかなり一般的になってきた感じがある
（ウェブアーカイブについての知識があるエンジニアにはこういう事をやってる人が多い）
でもそれは「データ収集手段としての保存」であって、ウェブアーカイブという「目的としての保存」を専門にしている人はほんの一握りよ

148192.168.0.7742019/04/18(木) 20:54:33.70ID:231mhavm0

Webスクレイピングは仕事になるけどWebアーカイブは仕事にならんものな
専門家が少ないのも道理

149192.168.0.7742019/04/19(金) 12:33:49.48ID:Sck2kHkT0

結局サイトはどうするよ
Googleドキュメントはお手軽だけど検索エンジンで見つからないし、Wikiサービスがいいと思う
Wikiの選択肢はatwikiかShoutWikiになるのかな

150192.168.0.7742019/04/20(土) 01:32:08.39ID:nlnJtIGb0

完全に人が消えてるな
>>74の予言が順調に実現して来てて笑う

151192.168.0.7742019/04/20(土) 02:38:53.71ID:EOflkhQE0

ネット上のデータを残し続けることに皆そこまで意義感じてないんじゃね

152192.168.0.7742019/04/20(土) 03:32:20.14ID:j74qt4l90

全部のリンクたどると凄い数になる。
数が多いと絞り込むのも大変だし、応答なしになるし、全部処理するということ自体出来るのか？と不安になるくらい次から次へとアドレスが出てくる。
過去に処理したやつ除外すれば…と思ったがかえって遅くなった。
あとURLが一部壊れてしまうのも原因不明。

153192.168.0.7742019/04/20(土) 10:06:44.64ID:uNdtbvPn0

あまりにも膨大で途方もないから
大抵の人は投げてしまうのさ

154192.168.0.7742019/04/20(土) 17:20:29.58ID:nlnJtIGb0

>>152
何のツール使ってんの？

155192.168.0.7742019/04/21(日) 03:12:31.96ID:BVyeUYoM0

昔に比べてネット人口が増えたけど、PCユーザー自体は減ってるんじゃ無いかと…

156192.168.0.7742019/04/21(日) 16:10:39.88ID:HZbpua5K0

増えてますよ

157192.168.0.7742019/04/21(日) 16:34:58.79ID:+zJhJQgi0

法人向けは売れてるだろうけど一般家庭はスマホばっかりでPC減ってるでしょ

158192.168.0.7742019/04/24(水) 03:14:37.20ID:KjJLD36j0

>>151
これって割と深刻なことじゃね？

159192.168.0.7742019/04/24(水) 04:15:47.92ID:015wg1cT0

旗を揚げられる人間がいないだけなんじゃないかとも思うけどね
知識とやる気が揃ってなきゃできねぇ
俺は白旗なら掲げられるぞ

160192.168.0.7742019/04/25(木) 00:55:31.95ID:keVKSV/80

旗掲げたいけど今年いっぱいは時間が取れねぇ

161あめ ◆P0jSlC5fJs 2019/04/29(月) 05:15:38.68ID:qYOC6Fj20

何をそんなに困ってるのかわからない
後は WebRecoder + ipwb を簡単にできたらおっけーじゃないの？

162192.168.0.7742019/04/30(火) 02:07:11.84ID:4bCzSUvm0

>>161
ログを読もう
端的に言うとやらなきゃいけない事が多い割に率先して出来る人間がいない

163192.168.0.7742019/04/30(火) 16:16:38.40ID:4bCzSUvm0

>>161
それだけでおっけーじゃないから皆こうやって話し合ってるのよ

164192.168.0.7742019/05/03(金) 12:31:09.57ID:/o+BXXwL0

テラバイトを溜めこむ、デジタルゴミ屋敷に棲むデータホーダーたち
https://www.gizmodo.jp/2019/05/digitalhoarder.html
断捨離にコンマリ。
そんなテクニックを使いでもしなければ、人は一度手にいれたものは、どうにも手放したくない
生き物のよう。
形ある物は必ず壊れる、諸行無常の響きはインターネットの世界でも鳴りわたっているようです。
わたしはハードディスクはかならずひとつ外付けを使ってデータをローカルと外付けの2回ずつ
保存しているんですよね。いまはそれはNASに変わりましたが、以前はDVDに焼いて保存したり、
FTPを使ったり、クラウドが台頭するようになってからはクラウドも多用していますが、どうも
クラウドもソーシャルメディアも永遠の存在ではなさそう。
今回は米Gizmodoで組んでいる｢ゴミ｣特集のひとつを翻訳しました。外部ジャーナリストのSteven
Melendezの書き下ろしです。ちょっと長いですが考えさられる内容。ぜひ、じっくりとご覧ください。

165192.168.0.7742019/05/03(金) 12:57:09.31ID:rDYW7khY0

gizmodoが世間からどういう評価を受けてるかわかった上でそれ貼ってるの？

166192.168.0.7742019/05/03(金) 17:24:56.15ID:AncjvUWJ0

腐れTwitter.5chまとめサイトよりマシ程度

167192.168.0.7742019/05/03(金) 17:39:06.81ID:s/8yyqZn0

どちらかというと >>164 はアーカイブに対してポジティブな記事だよ
ちょっと煽り気味の釣りタイトルだけどちゃんとアーカイビストの偉業を紹介してる
素直に褒めたくない意地悪さがにじみ出てるけどね

168192.168.0.7742019/05/04(土) 00:44:21.71ID:I7t6q7HU0

大量のアーカイブを管理するには個人だと限界があるわな
団体を作って分担作業し、出来ることならInternet Archiveのように社会的信用を得ないといけない

169192.168.0.7742019/05/04(土) 09:00:26.72ID:bL2u5kxf0

動画は円盤保存
画像と文字は印刷保存

170あめ ◆P0jSlC5fJs 2019/05/05(日) 05:55:19.34ID:YysNkSBx0

>>162
実はスレがたったときから居て1から読んでるんだよなぁ
記事少し作るだけでここまで悩む不思議
>>74 の未来を変えるために降臨したのに

171192.168.0.7742019/05/05(日) 15:45:48.96ID:fUOQo4az0

>>170
ならあんたが未来を変えてくれ

172192.168.0.7742019/05/05(日) 15:49:26.42ID:fUOQo4az0

そもそもIPFSで本当に良いのかって話になったまま議論が止まってたはず
そこからArchive Team Japan的なものを作ろうじゃないかって話になって、そんなものに貢献できる日本人はもう本家に行ってるだろって話になって、
日本人でウェブアーカイブやってる人自体少数だよねって話になって、結局グダグダになって現在に至る

173192.168.0.7742019/05/06(月) 19:41:21.46ID:6bTK53bC0

まず5ch自体オワコンだから人が集まるはずないよな

174192.168.0.7742019/05/07(火) 16:01:29.67ID:nOGBK00T0

それ
5chで集められる人数なんてたかが知れてるから、外部サイト作ってTwitterとかで広めないとキツい
優秀なエンジニアはTwitterにかなり集ってるし、関心を持ってもらえれば良いんだが

175py ◆o3kzHb/in8w0 2019/05/14(火) 19:06:58.64ID:cP8wStLG0

https://u1.getuploader.com/irvn/download/1657
web2IAWBM.dms ver0.000.007　WayBackMachineに保存　(web.archive.org) 2019/05/14

web2IAWBM.dmsはIrvineとDorothy2を使ってInternet Archive WayBack Machineに自動登録(保存)するためのスクリプトです。
自動で全てのリンクをたどって保存してくれるはずです。
web2IAWBM.dmsは素人が作った物なので至らない点も多々ありますが、
一応使える水準になったと思われるので公開します。
無料のウィルススキャンはしましたが、念のためもう一度スキャンされることをお勧めします。
同梱のDorothy2(の一部)は別の方が作った物です。
■ Irvine初回起動前に必ず jwordフォルダを削除してください。■

動作試験環境：windows10pro　Irvine1.3.1

176192.168.0.7742019/05/15(水) 02:01:39.76ID:kfIYGIBa0

>>175
Internet Archiveスレでも情報共有しとけ
手動Save Pages Now以外の方法を知らない人達ばかりだから相当喜ばれるぞ

177192.168.0.7742019/05/16(木) 17:03:10.13ID:/p1LTvuX0

ヤフー「Yahoo!コンテンツディスカバリー」サービスの終了を発表
https://media-innovation.jp/2019/05/16/yahoo-revealed-they-stop-ycd/

【解約と配信停止のスケジュール】
6月中旬頃　解約通知書の発送開始予定
9月2日　コンテンツ修正相談受付終了
9月6日　コンテンツ修正相談の結果問合せ終了
9月13日　入稿時審査受付終了・タグ発行・掲載面ブロック等の配信設定業務受付終了
9月20日　入稿時審査の問合せ終了
9月30日　Yahoo!コンテンツディスカバリー配信停止（順次）
11月29日まで　Yahoo!コンテンツディスカバリー管理ツール等の最終停止（順次）

178192.168.0.7742019/05/18(土) 21:20:44.41ID:thTbnaVW0

Yahooブログアーカイブ活動スレより引用

0031 Trackback(774) 2019/05/18 14:30:36
yahooブログは「記事がありません」のページで404を返すのだが、web2IAWBM.dmsが404のページを解析できなくてリンクをたどれていない可能性がある。
ブラウザでは普通にリンクをたどれる。
ID:l5DCkLS9

179192.168.0.7742019/05/21(火) 16:36:54.75ID:nRmqsex+0

サイトごとにやってると分かるけど、途中で止まってることがよくあるから、
終わったらブラウザで確認した方が良い。

180192.168.0.7742019/05/23(木) 11:34:52.72ID:LNdDY8yz0

Archiveteam (Google 翻訳)
https://translate.google.co.jp/translate?hl=ja&;sl=en&tl=ja&u=https%3A%2F%2Fwww.archiveteam.org%2F

181192.168.0.7742019/05/26(日) 10:51:40.72ID:oi3wUViY0

Index of /
http://infoseek_rip.g.ribbon.to/

182192.168.0.7742019/05/26(日) 11:04:21.99ID:oi3wUViY0

>>78
GeoLog Project
https://geolog.mydns.jp/
> お知らせ
>
> 2019/05/12 16:30
> ・URLを変更しました。リンク切れ等の不具合がもしあればご連絡ください。
> まだ旧ドメイン名が残っている部分がありますが、こちらは順次修正します。
> ・GeoCities URL収集 https://geo.98nx.jp/ 様にてアーカイブされたデータを順次統合中です。
>
> 2019/05/08 23:50
> ・近日中に、以下のとおりURLを変更します。
> 旧URL：https://thaliana.mydns.jp/GeoLog/
> 新URL：https://geolog.mydns.jp/
> 移転後も、旧URLはリダイレクトとして残す予定です。

183192.168.0.7742019/05/26(日) 16:31:09.43ID:LgR2vTtS0

>>1
>>3
>>5
>>6
死ね無能基地外

184192.168.0.7742019/05/28(火) 23:18:36.54ID:6dDxcHOe0

中学生かな？
まだ夏休みには早いと思うんだけど

185192.168.0.7742019/05/29(水) 00:22:00.05ID:LYQto7Hh0

毎日が日曜日

186192.168.0.7742019/05/29(水) 02:16:14.09ID:rgaJjZzR0

ん、IA調子悪いのか？

187192.168.0.7742019/05/29(水) 03:41:38.21ID:rgaJjZzR0

涼しいからスクリプト走らせようと思ったのに

188192.168.0.7742019/06/07(金) 03:14:38.91ID:EZciTwz+0

サーバーエラー出てる間のは保存されてないのに緑のチェックマークで成功扱いになるから注意して

189192.168.0.7742019/06/09(日) 15:40:45.70ID:S0wca8Kg0

メーリングリストの老舗「freeml」終了　22年の歴史に幕
https://www.itmedia.co.jp/news/articles/1906/03/news096.html

190192.168.0.7742019/06/12(水) 05:55:56.93ID:DnPdDFAp0

ニュース記事は２ページ目以降が保存されていないことが多いよな。
魚拓も、1ページ目を保存しただけでは、2ページ目以降は保存されないよな？
パッと見保存されているように見える

191192.168.0.7742019/06/13(木) 02:01:24.77ID:DBW1u0DS0

Webcite、何故かアクセスできない

192192.168.0.7742019/06/13(木) 02:43:36.27ID:Fctk1dcQ0

>>191
あぁまたか、あそこは良く DNS から消える。
でもサーバはしっかり生きてるんだな、これが。

193192.168.0.7742019/06/17(月) 14:43:18.30ID:Xz9V42zC0

GASにアーカイヴ作業させられないかな
10分おきに起動

194192.168.0.7742019/06/18(火) 15:34:14.81ID:MI2+ZpWl0

ニュース記事みたらSave Pageするのが習慣になってきた。

195192.168.0.7742019/06/19(水) 17:32:14.54ID:iJXbWhxE0

>>193
できそうな気もするがどうなんだろう

196192.168.0.7742019/06/21(金) 09:20:23.40ID:poW6yzCt0

同一のIPからの連続取得は制限されています。
同一のIPから24時間に60回以上の取得は出来ません。
【保存・記録】ウェブアーカイブ総合 Page.01 ニコニコ動画>1本 ->画像>14枚

197192.168.0.7742019/06/21(金) 14:13:34.55ID:9K2NkZ870

一日に間隔をあけて数回アーカイブするくらいなら何とかなるのでは
誰か試して見てくれ

198192.168.0.7742019/06/22(土) 15:09:24.70ID:S8tpOgcn0

ArchiveBoxというものを見つけた
自前のマシンでウェブアーカイブをするためのオープンソースソフトウェアだって
https://archivebox.io/

199192.168.0.7742019/06/22(土) 15:19:39.24ID:S8tpOgcn0

>>198
基本的にCUIで操作するものなので注意
自分でリンクを辿るのではなく、アーカイブするURLのリストを読み込ませる方式らしい
HTMLやWARCはもちろん、画像やPDFでの出力にも対応してるのが便利そう

200192.168.0.7742019/06/23(日) 20:49:35.28ID:27h915gg0

[JavaScript] Wayback Machine Script - Pastebin.com
https://pastebin.com/ZxryGY8F
Automatically save the page you visited (or all links you can see) to "Wayback Machine".
試していないので使えるかどうかはわからない

201192.168.0.7742019/06/25(火) 23:07:44.50ID:5uQFWJVA0

IAが昼過ぎからずっとメンテ

202192.168.0.7742019/06/26(水) 22:53:23.97ID:Qb0QQC6K0

配布終了したフリーソフトの保管庫も欲しい

203192.168.0.7742019/06/28(金) 15:19:25.28ID:JC6hqmSv0

getASFstreamも実行ファイルがIAから削除されてるな。

204192.168.0.7742019/06/28(金) 15:22:44.92ID:JC6hqmSv0

getASFstreamはVectorのが生きてたからまだ平気か。

205192.168.0.7742019/07/03(水) 17:10:46.83ID:0BbpBYkz0

ルートラボ2020年3月末終了
https://www.itmedia.co.jp/news/articles/1907/03/news096.html

これはWayback Machineでも保存できないので同じようなサービスにデータを
移行したもの以外のデータは消え去ることとなる。

これからこのようにアーカイブできないデータは増えていく一方だろう。

206192.168.0.7742019/07/06(土) 04:08:11.16ID:6FkUH5GE0

アーカイブできないデータの筆頭がオンラインゲーム・ブラウザゲーム・ソーシャルゲームだよねえ

207192.168.0.7742019/07/06(土) 14:21:01.48ID:GinQGT8r0

昔流行ったフラッシュはアドレス直打ちSavePageNowで保存できたけどゲームは分からん。

208192.168.0.7742019/07/10(水) 09:08:38.60ID:/L/aFHKF0

goo blogの「株式日記と経済展望」がいつの間にか見れなくなってる
IA見ると2019年1月7日の記事の最後にしばらく休みますと書かれている
https://web.archive.org/web/20190314154224/https://blog.goo.ne.jp/2005tora

209192.168.0.7742019/07/10(水) 16:20:17.46ID:fnXJF4Pm0

Wayback Machineやたら重いんだけど
時間帯によるもの？

210192.168.0.7742019/07/11(木) 07:59:17.31ID:7Pk3v1uW0

スクリプト走らせてる人が70人近くいるはずだし重くなっても不思議は無い。
保存されているかを確認するために実際に開いて確認してから保存している。
同じページを何度も確認していたなんてこともあると思う。

211192.168.0.7742019/07/13(土) 00:39:32.34ID:Y10L19C40

ここの住人にYahooブログをアーカイブしてほしい

212192.168.0.7742019/07/13(土) 13:20:12.05ID:LEU3bec70

異様に書き込み減ったし多分みんな保存してる。
個別にURL指定してくれれば優先する。

213192.168.0.7742019/07/16(火) 11:16:16.55ID:hXIS632N0

ジオシティーズの時のようにURal収集フォームみたいなのがあれば便利なんだけどな

214192.168.0.7742019/07/16(火) 11:17:07.12ID:hXIS632N0

タイプミス
URLな

215192.168.0.7742019/07/17(水) 12:47:13.54ID:8BflpvwW0

質問です。
Wayback Machineを使って、見たかったサイトは見つかったのですが、画像はありませんでした。
その画像を見つけることはもうできないのでしょうか？

216192.168.0.7742019/07/21(日) 06:02:59.22ID:PLd/1lFQ0

GASは程度にもよるが増やしすぎるとすぐこうなる。思ったより使えない。
> サービスで 1 日に使用しているコンピュータ時間が長すぎます

217192.168.0.7742019/07/25(木) 09:40:55.79ID:1TUd1BHY0

>>215
諦めた方が早いかと思われ

2182152019/07/28(日) 17:53:01.59ID:2hYx5uH+0

>>217
そうなんですか、残念ですがありがとうございます

219192.168.0.7742019/07/29(月) 23:47:11.38ID:0ZDdCLv30

220192.168.0.7742019/07/30(火) 03:06:48.87ID:w+bM/0cg0

ロリコンはネトウヨ
女叩きしてるのはBBA
DQNも何方かと言えばネトウヨ色が強い

5chとネット上で、金魚の糞を巻き散らかしてるのはコイツら

221192.168.0.7742019/07/30(火) 18:42:36.22ID:rAPLQn650

改憲なんてしてもアメリカが作った自作自演の戦争に巻き込まれて戦争犯罪に加担するだけじゃん。
愛国者なら9条改正には反対しないと。どこの国も上層部は裏で繋がっている、つまり中国韓国ロシアはアメリカと通じていて、本当の敵はアメリカの中にいる。
敵国条項は残っているんだから日本がちょっとでも怪しい動きしたらロシア中国韓国アメリカから攻撃されて今度こそ日本無くなるぞ。
そして、緊急事態条項は独裁完成法。
独裁完成したら安倍晋三が死ぬまで安倍政権が続くぞ。

222192.168.0.7742019/08/06(火) 03:38:43.37ID:AvYpPa1T0

ヤプログ！サービス終了のお知らせ
https://yaplog.jp/staff/archive/914

223192.168.0.7742019/08/16(金) 10:44:48.49ID:c/w5mu590

>>175のやつ最近のログ見たら保存されてないのに保存済みと表示されて保存してないURLある事に気付いた。
IA側が仕様変更したのか？

224192.168.0.7742019/08/16(金) 10:48:02.20ID:c/w5mu590

>>223
Show Allでは確かにキャプチャーがあるのに、それを開くとHrm.で表示できない。

225192.168.0.7742019/08/17(土) 23:15:30.53ID:Z4rWSf4u0

閉鎖がアナウンスされてるサービスについては、
Wikipediaから参考文献などとしてリンクを貼られているサイト、Twitterでシェアされているサイトを優先してアーカイブした方がいい
ジオシティーズの時もこの方式が取られてたと思う
Yahooブログのアーカイブを考えてる人がいたら参考にしてくれ

226192.168.0.7742019/08/18(日) 05:20:36.47ID:zB3uGj7T0

>>222

アドブロックが普及しすぎて、ブログサービスはどこも儲かっていないらしい。

227192.168.0.7742019/08/18(日) 22:44:14.13ID:lH1BP5oP0

最近はアンチアドブロックとかもあるよね

228192.168.0.7742019/08/18(日) 23:41:17.08ID:m6no0JBr0

>>226
スマートフォンだと余り普及して無いけど、
スマートフォンでブログやる人って少ないのかな…

229192.168.0.7742019/08/21(水) 04:09:45.48ID:x9gIR2Do0

https://shibuya-game.com/archives/53188

諸般の事情により、SHIBUYA GAMEは2019年9月20日をもちまして更新を停止し、2019年末をもって閉鎖します。

230192.168.0.7742019/08/21(水) 14:50:30.18ID:b3NNDeZP0

>>229
https://shibuya-game.com/all-posts/page/1
このURLを起点に全記事のURLを抜き取ってInternet Archiveなり何なりに投げればいいな
作業する余裕のある人あと1か月でよろしく

231192.168.0.7742019/08/21(水) 14:54:06.94ID:b3NNDeZP0

>>230
今のところ1768個の記事があるらしい

232192.168.0.7742019/08/22(木) 23:08:10.94ID:c46PChaz0

水谷修のサイト保存してくれた人いるのか

233192.168.0.7742019/09/14(土) 14:16:10.61ID:Xphq9GAC0

情報が古くても需要がありそうなのは
小説・漫画・映画のレビュー・考察サイト
ゲーム関係のサイト（攻略サイト・レビューサイトなど）
Web小説
あたりか

234192.168.0.7742019/09/15(日) 22:34:40.70ID:6+5CjbXu0

興味あるので保守

2352152019/09/20(金) 05:31:59.01ID:QM3MI5eR0

アーカイブしたいサイトがある時、どうやって保存するの？
Winなら巡集みたいなソフト使ってやるの？　Macではターミナル？

236192.168.0.7742019/09/23(月) 03:23:58.52ID:TCqq29480

ニコ生アラートのバイナリ保存されていない…残念

237192.168.0.7742019/09/23(月) 03:47:25.00ID:TCqq29480

>>235
>>175

2382152019/09/23(月) 05:25:08.76ID:2+4wj0ye0

>>237
Windowsしか書いてないけど、macで行ける？

239192.168.0.7742019/09/23(月) 08:45:19.53ID:TCqq29480

Macはもってないので分からない。
>>175のやつWindowsでも機能していない可能性がある。保存されたって出てるけど実際は保存されていないとか。

240192.168.0.7742019/09/25(水) 18:16:46.74ID:TR/fy2AH0

サービス終了に関するご報告
https://www.rich.co.jp/news_article/20190930/

＞この度、2015年よりサービスを続けてまいりましたメディア「ヘルスケア大学」について、当社事業領域の整理に伴い社内リソースを別領域に集中させることに決定し、2019年9月30日にサービスを終了することとなりました。

241192.168.0.7742019/09/27(金) 23:51:14.06ID:4H4+28EN0

ワイ「古い車買ったろ。整備は大変そうやけど、ネットには先人の知恵がいっぱいや」

1 ：名無しさん＠おーぷん：19/09/27(金)23:31:11 ID:2JG主 ×
ジオシティーズ「ん？」
ディオン「んん？」
ニフティー「んんん？」

2：名無しさん＠おーぷん：19/09/27(金)23:31:38 ID:2JG主 ×
先人の知恵、消える

3：名無しさん＠おーぷん：19/09/27(金)23:31:46 ID:6EZ ×
しゃーない

5：名無しさん＠おーぷん：19/09/27(金)23:32:30 ID:cUL ×
悲しいなぁ…

242192.168.0.7742019/09/28(土) 08:08:34.63ID:bq44L+WV0

各アーカイブサービスの検索機能が優秀なら良いんだけどな
保存してもそれを探し出せないなら死蔵と変わらんな

243192.168.0.7742019/09/29(日) 01:09:52.47ID:q9QXqdnD0

無料ソフトウェアのサイトは保存されてても実行ファイルを含むzipファイルは保存されていません。
可能な限り保存します。

244192.168.0.7742019/09/29(日) 01:34:12.78ID:T/2cpgi20

>>242
単にアーカイブしたファイルの中身に対して検索を行えるかどうかの話。
それを優秀などという語でしか表現できない貧弱なボキャブラリー。

245192.168.0.7742019/09/29(日) 02:04:44.22ID:q9QXqdnD0

Googleとかで「 site:web.archive.org」を付けて検索するのが現実的かと。

246192.168.0.7742019/09/29(日) 11:02:46.70ID:IeSWqng50

wikiうんぬんの話が出ているので、いくつか使ったことがあるから書いておくけど
atwiki　SeesaaWiki　FC2wiki　などはそれぞれ記法が独特でバックアップが取れない
atwikiは特に仕様がころころ変わる上に不具合発生率も高くて、書き込みだけに集中できないし
アカウントを削除してもサーバーからデーターが完全削除されないみたい

pukiwiki／pukiwiki plusベースのところはdumpデーターは取得できるけど
運営が個人だったり個人で会社を作ってやっているところはその人がどうにかなると連絡が取れなくなる
それでもサーバーやドメインが維持されいるとサービスは利用できるけど
ある日突然使えなくなることがある

247192.168.0.7742019/09/29(日) 12:20:42.26ID:T/2cpgi20

コンテンツ制作側としてのバックアップの話をここでやってどーするの。

248192.168.0.7742019/09/29(日) 12:33:23.11ID:IeSWqng50

個人サイトで無料／有料に関わらず共用サーバーを使っている場合
サーバー管理会社によってサーバーのスペック変更が行われると
サービスが終了していなくてもサイトが閲覧不可になることがあるよね

PHP5.3までしか対応していないものを使ってサイト運営をしているのに
サーバー側がPHP7.2にしちゃったとか
サーバーを丸ごと交換してデフォルトがUTF-8になったのに
サイトのほうでcharsetを指定していないとか
DBのバージョンが上がってデーターが呼び出せなくなった
等の理由で、閲覧が困難になるケース

閲覧しに行って真っ白だったり文字化けしていたりするのはこの辺の理由

249192.168.0.7742019/09/29(日) 12:56:37.11ID:T/2cpgi20

なんだ、新手のスレ埋め立てかw

250192.168.0.7742019/09/29(日) 13:09:54.41ID:T/2cpgi20

そういやPukiWikiのサイトをInternetArchiveで保存させる場合、
一覧ページから数階層分のURLを掘って、その全URLに/save/リクエストを
発行すれば完了だろうな。
適当なツールが無ければIrvineとメモ帳のテキスト置換機能を使えばよい。
ソースのバックアップの話はスレチ。

251192.168.0.7742019/09/29(日) 17:04:53.57ID:q9QXqdnD0

このスレで使うwikiが消滅する場合の対策の話じゃないの。

252192.168.0.7742019/09/29(日) 22:23:17.96ID:n8nVup7e0

>>244
人の揚げ足取る暇があったらアーカイブしろ

253242=2522019/09/29(日) 22:32:55.86ID:n8nVup7e0

だいたいページ内容の走査だけで検索機能実装しても優秀とは到底言えないからな
検索エンジンサービスのようにページランク等を考慮して初めて、優秀というかようやく使いものになる
アーカイブサービスのように膨大な数のページを検索しなきゃいけない場合は、そういったアルゴリズムの必要性がさらに高まる
こういう話をいちいちするのが面倒だから話を全部ひっくるめて「優秀」の一語で表現した
これで満足か？

254192.168.0.7742019/09/29(日) 22:36:12.79ID:n8nVup7e0

ページランクは固有名詞に近いからランキングアルゴリズムと言うべきだったかもしれない

255192.168.0.7742019/09/29(日) 22:40:09.36ID:n8nVup7e0

クソリプが跋扈するツイッターや人口の多い他の5ch板ならまだしも、
このご時世にこんな専門板で、横からいきなり会話してる訳でもない相手からレスが飛んでくるとは思わなかった
随分面食らったわ

256192.168.0.7742019/09/29(日) 22:48:43.54ID:T/2cpgi20

Wiki立てる話自体が消えたと思ってたw

257192.168.0.7742019/09/30(月) 11:04:24.16ID:MZVGPwZn0

>>256
また話が出るかもしれないから一応書いておいただけ

atwiki上のサイトで差分が見れないところがあったから
archive.orgで探してみたけど
archive.orgのbotをatwikが蹴っているみたいで最近はエラーページが保存されちゃってる

意図的にそのページを残したい人がarchive.orgのアカウントを作って残す場合は別として
消えちゃったページを後からarchive.orgで探すのは難しくなっていると思うよ
クローリングの期間がだいぶ開いている
これはGoogleのキャッシュもそうだと思う
サイトを運営している人がGoogleのアカウントを取得して
Google Search Consoleからクローリングのリクエストを出して当然ってなってきているみたい

258192.168.0.7742019/09/30(月) 15:43:12.38ID:yT22Xmkr0

>>245
実際に検索してみると分かるけど、その方法だと引っかからないアーカイブが結構あるんだよな
Googleのクローリングが追いついてないんだと思うけど

259192.168.0.7742019/09/30(月) 17:16:29.06ID:yT22Xmkr0

【ヤフー】Yahoo!ブログ【アーカイブ】
http://2chb.net/r/blog/1554380939/l50/

74 Trackback(774) 2019/09/30(月) 17:07:59.58ID:th5gp/Yr
Internet ArchiveでYahooブログを保存すると遷移スクリプトが発火する話なんだけど、
web.archive.org/save のページから「Save outlinks」にチェックを入れて保存すると
どうもYahooのトップページに遷移されずにアーカイブできるみたいだ
さっき偶然発見して何回か試したけど今のところ全て上手く保存されてる

260192.168.0.7742019/10/08(火) 01:13:45.16ID:MXp0IOeT0

Twitter埋め込みが一切保存されない問題

2612152019/10/08(火) 08:01:40.33ID:GswYVQiV0

>>260
アメリカの図書館にいけよ

262192.168.0.7742019/10/08(火) 14:30:06.60ID:fXMCPs+v0

アメリカの図書館はもうTwitterの全保存やめたんじゃなかったか

263192.168.0.7742019/10/18(金) 01:06:58.74ID:F6Bah8760

当時の「魔法のiらんど」上で作られたサイトは現在ではほとんど残っていない。
WebArchiveでも表層しか掘れないサイトばかりである。
当時の掲示板でのやりとり等はもちろん、かのクレリアさんが自サイトに書き記していた構築解説ですらも現在は散逸してしまった。

264192.168.0.7742019/10/25(金) 10:22:59.94ID:ZZgmHhFq0

手動で一ページずつやってもToo Many Requestsになって捗らないな。
Wayback Machineは金払うから一気に取得かアップロードさえて欲しい。

265192.168.0.7742019/11/03(日) 20:32:03.04ID:I05N5XH+0

もしかしたらしたらば掲示板やばいかもしれんな

266192.168.0.7742019/11/03(日) 22:05:54.91ID:IGp2y1Ub0

>>265

理由は？

267192.168.0.7742019/11/04(月) 01:30:31.73ID:d2EYioZ60

>>264
有料取得依頼みたいなんなかったっけ

最近Archive Today重いのは俺だけかい？
すぐNetwork Errorになる

268192.168.0.7742019/11/04(月) 07:36:42.44ID:1kde+9Me0

したらば掲示板が丸一日メンテナンスしてたみたいですな。

269192.168.0.7742019/11/05(火) 18:04:06.02ID:P7AeCNyG0

>>258
そういや最近グーグルってサイト作成者がクロール要求しないと
なかなかクロールしてくれないってどっかの記事で読んだような気がする。

↓こういうのをテキストエディタで作ってからIrvineの「URLを展開して貼り付け」をすると全頁まとめて登録できる。画像一覧とかも同様
https://blogs.yahoo.co.jp/************/MYBLOG/yblog.html?m=l&;p=[1-最後のページ番号]
例のスクリプトの登録漏れをある程度減らせると思う。

270192.168.0.7742019/11/10(日) 04:30:49.20ID:gZ07cm7t0

誰かここに載ってるサイトだけでも保全してくれ

yahoo！ブログ使用サイト - DoldoWorkz
https://moondoldo.com/DoldoWorkz/?yahoo%EF%BC%81%E3%83%96%E3%83%AD%E3%82%B0%E4%BD%BF%E7%94%A8%E3%82%B5%E3%82%A4%E3%83%88

271192.168.0.7742019/11/10(日) 19:44:29.07ID:OJOj/1ou0

何故自分でやらないのか

272192.168.0.7742019/11/10(日) 22:43:10.93ID:Qg+FaNtt0

ジオシティーズの時もそうだったが、特定サービスのアーカイブって何だかんだ言ってかなりの時間と労力を必要とするんだよ
自分でやりたいのは山々だが、そこに労力を注ぎ込める余裕がない
なのでアーカイブをやっている人が多少は集まっているであろうここに投げた

273270=2722019/11/10(日) 22:45:26.50ID:Qg+FaNtt0

>>270のサイトの作者と自分は何にも関係ないことは一応断っておく

274192.168.0.7742019/11/11(月) 09:12:05.10ID:DmcMWPY20

Yahooブログにアーカイブすべき物なんてあるのか？

275192.168.0.7742019/11/11(月) 10:42:59.86ID:HD2VAMf80

単なる日常記録も多いけど、そこらのジオシティーズよりも濃い情報が詰まってるものも多いよ
自分が知ってる範囲だと、今は消えた街並みの記録や京都のマイナーな神社の訪問記、イギリスでの聖人信仰の研究サイト、ゲーム業界の裏話やゲーム攻略などがあるよ
自分が知ってる範囲のブログだけはいくつかWayback Machineに突っ込んだが、他にも有益な情報がたくさん眠ってると思うよ
Yahooブログなんて消えても誰も困らないだろうと思ってる人が結構いるみたいだが、とんでもない偏見だよ

276GeoLog Project ◆RJRIJK3wcLw8 2019/11/11(月) 20:36:22.34ID:kHI2SrFf0

>>270
試しにhttrackに突っ込んだら画像のリンクが取れず、
調べたら元のHTMLにはないリンクを後から生成して突っ込んでますね。。。

動的サイト嫌いです。。。

277192.168.0.7742019/11/11(月) 23:27:18.77ID:HD2VAMf80

動的サイトのWebアーカイブ用クローリングとなるとHeritrix(Internet Archiveが使ってるクローラ)の出番ですね
実績もあるし高性能で拡張性もそれなりにあるものの、マシンの要求スペックが比較的高めなのが難点か

278192.168.0.7742019/11/14(木) 17:49:41.79ID:zR5VNa+N0

Heritrixの最低動作スペック自体はそこまで高くないよ
ただ、リッチなコンテンツを含むページをアーカイブしようとするとメモリを食うことがある
あと基本的にLinux環境しかサポートしていないので、人によっては手が出しにくいかもしれない

279GeoLog Project ◆RJRIJK3wcLw8 2019/11/15(金) 00:48:08.16ID:jfECE9r+0

Windows でも動くには動きますね
しかしやたら遅い・・・

280192.168.0.7742019/11/17(日) 22:45:04.48ID:n+VdMpHA0

メモリ持て余してるけどストレージが足りない
ArchiveTeamWarrior的なのがあれば参加するんだけど

281192.168.0.7742019/11/19(火) 15:35:27.56ID:WcaVo5T50

ArchiveTeamに常駐してる人がここにいれば捗るんだが

282192.168.0.7742019/11/22(金) 05:16:46.52ID:8zBYuW1S0

むしろ元のHTMLの方には正しいリンク先URLがあるんじゃないの。
それで画像取得できないだろうか

283GeoLog Project ◆RJRIJK3wcLw8 2019/11/22(金) 20:15:18.83ID:fS5sbz5I0

>>282
拡大すると大きめの画像のあるページってどこかありますか？

284192.168.0.7742019/11/24(日) 23:10:35.97ID:Sj5SnpvV0

>>283
「拡大すると大きめの画像のある」って言うのがどういう意味かよく分からないので、もう少し詳しく説明をお願いしたい

2852152019/11/25(月) 05:25:36.43ID:U4MdffN+0

>>284
ライトボックスとかじゃない？

286GeoLog Project ◆RJRIJK3wcLw8 2019/11/25(月) 20:34:05.84ID:KvWZhxVE0

>>284
言葉足らずですみません

Yahoo!ブログは画像をクリックすると別ページに飛んで元の大きい画像が見られるらしいのですが、
ページのimgタグに書いてある画像より、元画像の方が大きい例があるかどうかを気にしました
>>282 の「元のHTML」に元画像へのリンクがあるのか確認したかったので

287192.168.0.7742019/11/27(水) 13:24:37.22ID:+cJOWs3G0

Twitter、休眠アカウント削除へ　対象アカウントに12月11日までにログインするよう警告
https://www.itmedia.co.jp/news/spv/1911/27/news069.html

これ亡くなった著名人などのアカウントも容赦なく削除するらしいから、期限までに出来る限りアーカイブしておきたいところ
Twitterで #休眠アカウント削除がトレンド入りしてるから、アカウントが消えるのが嘆かれてる故人のアカウントはこれでかなり拾えると思う

2882152019/11/27(水) 18:54:59.39ID:y0cHyaRo0

>>287
やり方おせーてくれたら手伝えるけど

289192.168.0.7742019/11/27(水) 19:47:11.55ID:+cJOWs3G0

ArchiveTeamが動き出したな
https://twitter.com/textfiles/status/1199459588594176000
https://twitter.com/5chan_nel (5ch newer account)

290192.168.0.7742019/11/27(水) 21:52:41.92ID:+cJOWs3G0

>>288
とりあえず一番手っ取り早い方法は、>>289のツイートに貼られてるリンク先の入力フォームから、
保存して欲しいアカウントのIDを入力して送ること
もしかしたら他にも誰かが保存プロジェクトをやってるかもしれないから要調査だな

291192.168.0.7742019/11/30(土) 02:24:56.11ID:mj1OwWx+0

minori official web site
http://www.minori.ph/
このサイト、キャプチャできない

292192.168.0.7742019/11/30(土) 04:08:01.49ID:IS98dA580

>>291
海外からのアクセスに対し 403 Forbidden エラーを返すよう
設定されているみたいですから、Internet Archive や Archive.is では
無理でしょうね。
さらにそのエラーページは他サイトへの遷移スクリプトが
埋め込んであるので、フツーの人はエラー扱いされていることすら
気付けないでしょう。

当該エラーページの HTML ソースを貼っておきます。
https://pastebin.com/Vy7uYhiK

2932152019/11/30(土) 05:13:24.84ID:Yk7eFuvo0

>>290
DLだけ、自分でってことはできないの？

294192.168.0.7742019/11/30(土) 10:31:13.20ID:b+Bfz/GQ0

>>293
自分のPC中にアーカイブをローカルで保存することは出来ないかってこと？
Heritrixなど動的サイトを処理できるクローラを使えば問題なく出来る、出来るけどアーカイブは死蔵してたら意味が無いからね
自分だけで閲覧する用に保存しておくこともありうるけどそれはアーカイブとは言えない
ArchiveTeamが収集したファイルはWayback Machineに登録されるようになってるので、そういう意味では安全

295192.168.0.7742019/12/02(月) 04:15:35.70ID:Z+Zveon+0

最近のToday

296192.168.0.7742019/12/03(火) 03:09:24.37ID:zKh+7e4i0

Current Running Warrior Project: Yahoo! Groups

297192.168.0.7742019/12/03(火) 03:21:33.26ID:W45k6bBP0

Yahoo GroupsはYahooブログとは全くの別サービスだから早とちりすんなよ

298192.168.0.7742019/12/03(火) 03:23:09.41ID:W45k6bBP0

これのことだよ
https://japanese.engadget.com/2019/10/17/yahoo-groups-21-12-14/

299192.168.0.7742019/12/04(水) 17:38:24.46ID:OvwZOsOX0

本日のToday

300192.168.0.7742019/12/06(金) 00:57:47.89ID:QIt7pou20

300

301192.168.0.7742019/12/14(土) 23:22:02.29ID:AA4HPrSj0

Ci-en移行に伴うDLsite blogサービス提供終了予定のお知らせ
http://home-info.dlsite.com/archives/9427708.html

302192.168.0.7742019/12/15(日) 18:24:18.14ID:r3L4BzMu0

Yahooブログ今日までか

303192.168.0.7742019/12/16(月) 16:10:29.42ID:RltCXRJ+0

ほとんど何もできなかった

304192.168.0.7742019/12/16(月) 19:43:00.36ID:oxia7Ong0

少しは頑張れよ

305192.168.0.7742019/12/16(月) 22:27:54.54ID:P9Fjib/40

人いねえもの
呼び掛けが不十分だとこうなってしまう

306192.168.0.7742019/12/17(火) 00:52:29.58ID:SWkI+H1w0

>>272 >>294
リンク構造維持できて程々の容量に収まるなら分割rarやzipに纏めてもらってもいい。

今は低速スマホしか使う余裕無くなったから巡集やWeboxみたいな取り込みアプリで一括アーカイブ化するのも無理だし
読売の縮刷版CD/DVDなんかは1年分で12万もするし

307192.168.0.7742019/12/17(火) 04:05:12.57ID:FbEfAMeJ0

スマホ(笑

308192.168.0.7742019/12/17(火) 23:19:41.41ID:ZjrTQ21f0

ネットサービス企業は、スマホからの収益がメインやから、

PCだけに成ったら大倒産時代や

309192.168.0.7742019/12/18(水) 01:13:33.38ID:7iAMrhRQ0

色々と話がとっ散らかって来たな
>>306からして何が言いたいのか今一つ要領を得ない

310192.168.0.7742019/12/19(木) 20:23:09.25ID:s5RLoz8q0

もうyaplogに行ってる

311192.168.0.7742019/12/19(木) 22:41:03.12ID:yyGOrfnZ0

yaplogって1月でサービス終了するらしいけど
https://nlab.itmedia.co.jp/nl/articles/1908/03/news034.html

312192.168.0.7742019/12/19(木) 23:36:07.17ID:P9Gt+F0u0

geocitiesのアーカイブサイトは複数ある様だけどYahoo!ブログも有る？

313192.168.0.7742019/12/20(金) 01:21:34.83ID:W2QHpneb0

>>312
Yahooブログスレの方にも載ってないから今のところないんじゃないかな

314192.168.0.7742019/12/28(土) 07:55:33.34ID:GiJFu1gz0

Archive.TodayはグーグルやBingのキャッシュを保存した場合でも原本URLを認識できるのが素晴らしい。

315◆P0jSlC5fJs 2019/12/29(日) 21:46:36.02ID:3C6Rg8sC0

archive.todayのTwitterの魚拓がモバイル版にならなくなった？
アカウントは新UI、ツイートは旧PC用UI

316◆P0jSlC5fJs 2019/12/30(月) 13:29:31.10ID:dXRB6Vq/0

>>315
それどころかアカウントの魚拓がかなり下の方までスクロールされた状態で保存されるようになった
つまり1回の魚拓でかなりたくさんのツイートが保存されるようになった
いいね

317192.168.0.7742019/12/30(月) 23:49:45.17ID:Sts0O97Y0

>>314
検索で出ないことあるからやっぱ微妙だった

318192.168.0.7742019/12/31(火) 18:45:45.57ID:eDEktBsz0

Webサイトの保存ってみんなどうやってしてるの？
このスレにすでに書いてたらすまん

319192.168.0.7742020/01/02(木) 07:10:20.03ID:5F6LDkXn0

ローカル保存&魚拓

320192.168.0.7742020/01/02(木) 10:39:14.28ID:ucP82yGj0

魚拓ってのは
https://megalodon.jp/
でローカル保存ってのはchromeなんかにあるオフラインで読む系機能であってる？

321192.168.0.7742020/01/03(金) 19:36:03.17ID:c4MpYdMH0

それであってる

322192.168.0.7742020/01/04(土) 18:01:40.04ID:G3xvEvXn0

激重で読み込めない…

323192.168.0.7742020/01/04(土) 20:37:51.83ID:YBh70eiZ0

Scheduled Maintenance
The Internet Archive's sites are offline for scheduled maintenance and upgrades.
Please check our twitter feed @internetarchive for updates.
Sorry for the inconvenience.

324192.168.0.7742020/01/05(日) 21:23:51.28ID:JtWpXhr50

Yaplog取ってたらこんなの出てた
https://web.archive.org/web/20200105113649/yaplog.jp/mahou93/archive/645

325192.168.0.7742020/01/06(月) 15:29:48.32ID:HEWxGNJX0

>>321
ありがとう

326192.168.0.7742020/01/09(木) 07:45:46.22ID:0Jucozb10

4年以上未ログインの Yahoo! JAPAN ID、2020年2月から順次利用停止へ
https://japanese.engadget.com/jp-2020-01-07-4-yahoo-japan-id-2020-2.html

これひょっとしてYahooボックスで公開されてるファイルとかもごっそり消えちゃうんじゃ・・・
と思ったけどほとんど見かけないから影響あんまり無いかな

327192.168.0.7742020/01/09(木) 21:40:15.88ID:y/kpjRu/0

Yahooボックスってサービス終了して無かったのか…

328192.168.0.7742020/01/18(土) 22:33:46.55ID:Mw+axOW50

魔法のiらんどは2020年春に大リニューアルします！ - 魔法のiらんど https://maho.jp/renewal/
オワタ

329192.168.0.7742020/01/19(日) 04:35:51.86ID:qrJ0vAPo0

やったぜ

330192.168.0.7742020/01/19(日) 06:21:23.58ID:c42zUqjI0

>>328

魔法のiらんど　はまだ存在しているのかｗ

331192.168.0.7742020/01/24(金) 17:33:52.87ID:TbU4PUEj0

https://archive.org/

ここに

http://ishidate.my.coocan.jp/index.html

の、「Visual C++の勉強部屋」は保存できてるようなんだけど
「Visual Studio Community 2017でPythonを始める」が
トップだけあって他のリンクが上手く保存が出来てないようなんだけど
残す方法ありますか？始めてやろうとしてるので変な残し方をしたら気まずい・・・

332192.168.0.7742020/01/24(金) 17:40:24.75ID:TbU4PUEj0

あれ？慌てただけで反映されてなかっただけかな？

http://ishidate.my.coocan.jp/python/python.htm

上から2個目まではアーカイブされてました、すみません
一個ずつセーブしていくのかな？2個目はやってないはずなんだけど
トップページをセーブすると、自動で全部の保存処理をしてくれてるのだろうか？

333192.168.0.7742020/01/24(金) 19:35:46.36ID:DGrUFhpx0

>>331-332
すみません、反映するまで時間が掛かってただけのようです
順調に保存が進みました

334192.168.0.7742020/01/30(木) 04:23:53.98ID:DpjoWFqw0

上の保存出来たと思ったら何も変わってなかった
もう訳が解らん、個人的にローカルへ残す事にします・・・

335192.168.0.7742020/01/30(木) 09:17:01.89ID:QEGy6HlG0

最近財政難を表明してからInternet Archiveはやけに不安定だからなあ
Internet Archiveのシステムはページをクロールする部分とクロールしたページを表示する部分に分かれてるんだけど、最近は後者の部分がやけに不安定だったりする
閲覧できてないだけで実は保存できてたりすることもあるけど、不安ならオフラインコピーや他のアーカイブサイトを使うといい

336192.168.0.7742020/01/30(木) 09:18:37.13ID:QEGy6HlG0

まあ財政難表明する以前からちょくちょく不安定になることはあったんだけど、最近は不安定になる頻度がやたら高くなってきてる
保存されるアーカイブの量にリソースが追いついてないらしい

337GeoLog Project ◆RJRIJK3wcLw8 2020/02/10(月) 00:45:52.91ID:QUFKIIvC0

魔法のiらんどのURL収集を始めることにしました
知っているURLがあれば追加してください
https://geolog.mydns.jp/maho/

338192.168.0.7742020/02/10(月) 15:13:07.48ID:GaTPIR040

Geocitiesのときはいくつかブックマークから追加したけどiらんどはなかったよ・・・

339192.168.0.7742020/02/17(月) 12:57:14.40ID:JLl8Pqxs0

Wayback Machine ツイッターが簡単に登録できなくなったね
try againになる

340192.168.0.7742020/02/21(金) 08:24:33.38ID:SqQJO7aU0

ウェブ魚拓にロボット扱いされるようになった。
手動でやってるのに。
【保存・記録】ウェブアーカイブ総合 Page.01 ニコニコ動画>1本 ->画像>14枚

341192.168.0.7742020/02/21(金) 08:42:25.85ID:SqQJO7aU0

と思ったらReCaptcha導入でgyo.tc/urlまでもが廃止されたのかよ。
ReCaptchaの画面に飛ばしてくれればいいだけなのに。
タイトル画像詐欺になってるがな。

342192.168.0.7742020/02/21(金) 08:50:19.65ID:SqQJO7aU0

右下のリキャプチャマーク表示されてから5秒数えてから押せばいけるっぽい？

343192.168.0.7742020/02/25(火) 14:42:33.24ID:RVV1cF750

https://web.archive.org/
ここ一週間くらい調子悪いね？

保存できたと思って翌日くらいに見ようとしたら消えてて見られなくなってる

344192.168.0.7742020/02/25(火) 23:55:53.96ID:jlsY//Cy0

Internet Archiveはアーカイブ実行用クローラ(Heritrix)と
保存したアーカイブの専用ビューワ(Wayback)を組み合わせて動いてるんで、
保存したアーカイブがサーバ不調で一時的に見られなくなってても、
アーカイブさえきちんと出来てればそのうち問題なく見られるようになる

345192.168.0.7742020/02/27(木) 12:58:06.64ID:mwbfDK4S0

>>344
本当ですね！
さっき見てみたら復旧されたようでちゃんと保存できてました！

346192.168.0.7742020/02/29(土) 11:53:24.69ID:zPIV21fz0

アーカイヴトゥデイがGoogleキャッシュだけでなくBingキャッシュも原本と関連付けてくれれば神なんだが。

3472152020/03/20(金) 19:04:44.43ID:JhAw491V0

大住：僕は父親が来て、探偵ファイルをやめるべき理由を膨大に書き連ね
「これ以上やるなら親子関係を考えざるを得ない」と結んだ手紙を置いていきました。

ｗｗｗｗｗｗｗｗｗ

348192.168.0.7742020/03/24(火) 15:24:23.68ID:y1vf31FW0

Mが九つ…これはリッジレーサーのあの曲ですねぇ…間違い無い

349192.168.0.7742020/03/29(日) 00:39:38.40ID:fQaeQ4aI0

【リマインド】魔法のiらんど
2020年 3/31 リニューアルに伴いホームページ機能終了
アーカイブの必要がある場合は早急に対応を。

https://maho.jp/renewal/

350192.168.0.7742020/04/11(土) 13:13:02.49ID:wGeDLnxf0

削除されたなろう小説や Wayback Machineでも見れないサイトを見たいなあ

351192.168.0.7742020/04/12(日) 03:38:35.21ID:9mojHch+0

レビューサイトや攻略サイトはどんなに古くても価値があると思う

352192.168.0.7742020/04/17(金) 16:09:58.55ID:jHjl/hvx0

Todayにリキャプチャ付いた。かわりに画像単体のキャプチャができるようになっていた。

353192.168.0.7742020/04/17(金) 17:07:42.90ID:hEp8fbMZ0

archive.today (archive.is)

URLがいくつもあるわけだが

archive.today
archive.is
archive.li
archive.fo
archive.vn
archive.md
archive.ph

ひとつがサーバーダウンしている時には
他のURLも使えないのかどうか。

354192.168.0.7742020/04/17(金) 19:43:09.88ID:DEdL3XQ50

>>353
名前を色々と増やし始めたのはこれが発端。
http://2chb.net/r/esite/1189771222/587-590

ドメイン名乗っ取り攻撃に対する冗長性確保が目的。
何れかの名前が乗っ取られても他の名前で利用できるようにしてあるだけで、
> ひとつがサーバーダウンしている時には
> 他のURLも使え
～るといった 20 年前みたいな事は意図していないはず。

355192.168.0.7742020/05/10(日) 10:41:36.22ID:qgpD+Q890

「DLsite blog」サービス終了予定のお知らせ【5/28(木) 13:59まで】
http://home-info.dlsite.com/archives/9506936.html
月末ではなく28日昼まで

356192.168.0.7742020/05/10(日) 18:31:31.05ID:0BWUOz3X0

>>355

> 「DLsite blog」

そんなブログサービスがあるということを今はじめて知った

357192.168.0.7742020/05/13(水) 22:57:43.18ID:+6V16oE90

>>351
そう簡単に常識が変わるわけではないジャンルだしな

358192.168.0.7742020/05/21(木) 20:23:00.43ID:tw1fIQhk0

ニッチなニーズかもしれませんがスクリプトを公開しました。
Wayback Machine でURL検索をした際、最古または最新のページに自動で飛びます。
https://greasyfork.org/ja/scripts/403724-wayback-machine-auto-hopper

359192.168.0.7742020/05/25(月) 18:40:03.53ID:DqvUJCjh0

2020年6月30日
連合型SNS『マストドン』日本2位,3位のインスタンスが閉鎖
・msdtn.jp (登録20万人, 5500万トゥート)
・mastodon.cloud (利用者数6万人, 340万トゥート)

SNS『mstdn.jp』、誹謗中傷への対応の事務負担増に耐えられないと判断して6月30日で閉鎖へ
https://news.yahoo.co.jp/byline/shinoharashuji/20200525-00180247/

運営引き継ぎも募集しているらしい
https://mstdn.jp/about

360192.168.0.7742020/06/12(金) 19:07:45.35ID:Ex7ysahg0

コレで問題無しかな？
>>359
終了予定だった国内最大級のマストドンインスタンス「mstdn.jp」、サービス譲渡し継続
https://nlab.itmedia.co.jp/nl/articles/2006/11/news153.html

361192.168.0.7742020/06/12(金) 20:04:22.23ID:kaj5j2rY0

>>360

外資は儲からないと判断するとすぐ撤退する傾向が強いからなあ。不安。

362192.168.0.7742020/06/12(金) 23:01:41.40ID:r8G+EqEg0

「誹謗中傷の証拠取得用に」と謳った「Twitter魚拓」なるWebサービスが出来てバズってるが、
やってることは単にスクショ撮ってimgurに上げるだけらしい
スクショはブラウザの開発者機能でいくらでも改竄できるし、
これならArchive.isの方がずっと優秀だな
スクショに法的な証拠能力ってあるのかな

363192.168.0.7742020/06/12(金) 23:03:10.00ID:r8G+EqEg0

>>361
買収先は確かTwitter非公式クライアントの開発チームじゃなかったっけ
儲からないのは織り込み済みじゃないかな？

364◆P0jSlC5fJs 2020/06/15(月) 08:25:53.32ID:8HydZjTx0

webrecorder.ioの名前とURLが変わった
https://blog.conifer.rhizome.org/2020/06/11/webrecorder-conifer.html
新しいURL
https://conifer.rhizome.org/

365192.168.0.7742020/06/18(木) 15:31:00.91ID:YE4F+hQG0

Twitter魚拓に画像ハッシュを電子署名で埋め込む機能がやっと付いたらしい
結局画像を撮る前の段階で偽造可能なのはどうしようもないけど

366192.168.0.7742020/06/20(土) 02:54:49.17ID:h9ZrYl1H0

archive todayの魚拓検索でURL以外の文字列入力すると
Googleのカスタム検索経由で全文検索できるようになってるな

367192.168.0.7742020/06/20(土) 03:30:32.99ID:7f7o1of+0

旧Yahoo地図が完全終了するらしい
ジオカタログ製の世界地図が便利だったから終了するのは惜しい

https://map.ultra-zone.net/y/35.681236/139.767125/6

368192.168.0.7742020/06/20(土) 12:12:23.28ID:D5VLdHFC0

Googleのやつより見やすいな
日本語で書いてあるせいか？

369192.168.0.7742020/06/24(水) 20:08:29.48ID:VaXpj8XL0

149 名前：名無しさん＠ggmatome ：2020/06/24(水) 19:41:32 ID:GJp4RZxo0
Adobe Flash Playerの2020年末サービス終了は、古いゲームの公式サイトとかに影響が出そう

370192.168.0.7742020/06/25(木) 23:41:47.74ID:dwRtuOnD0

ArchiveTeamがなんかやってるかなと思ったけどまだ動いてないっぽい

371192.168.0.7742020/06/27(土) 14:07:35.48ID:qfiK+Scz0

Flashの保存活動やってる人自体はいるよ
ArchiveTeamが動いてないだけかと

372192.168.0.7742020/07/01(水) 06:54:14.16ID:pvfyXrsy0

This URL has been excluded from the Wayback Machine.のサイトも掘り出したいわね

373192.168.0.7742020/07/01(水) 07:00:53.26ID:pvfyXrsy0

Wayback Machineで見れない主なドメイン
http://dion.ne.jp/
http://biglobe.ne.jp/
http://homepage2.nifty.com/

374192.168.0.7742020/07/01(水) 11:22:29.30ID:ha7maYO50

かなりデカい保存対象がやってきた

NAVERまとめサービス終了のお知らせ : NAVERまとめ公式ブログ
http://navermatome-official.blog.jp/archives/83259956.html

>突然ではございますが、NAVERまとめは2020年9月30日をもちましてサービスを終了することとなりました。
>下書きや非表示のまとめも含め、9月30日をもちましてすべて閲覧ができなくなります。

375192.168.0.7742020/07/01(水) 20:40:49.49ID:36DWDi3y0

naverブランドじゃ将来性見えないもんな
かといってヤフー、ラインブランドに変えてまでやるほどでもないし

376192.168.0.7742020/07/01(水) 22:39:13.89ID:4eKj5JMl0

>>373
いちいちブロックしてたらキリがないなろう系サイトはともかく
こういうドメインは一部のサイトだけ見れないように緩和してほしいわ

377192.168.0.7742020/07/02(木) 03:05:37.80ID:qEIVQ0nx0

Webサイト保存してる人はなに使ってる？

自分は巡集とWebsite Explorerを使ってる

378192.168.0.7742020/07/02(木) 22:25:47.86ID:PGzwXvql0

>>371
ちなみにFlash のアーカイブって何やるの？

379192.168.0.7742020/07/02(木) 22:55:14.72ID:VMG0QPRf0

>>374
ほぼコピペしか無いサイトだからオリジナルのデータは少なそう…

380192.168.0.7742020/07/03(金) 01:54:56.18ID:pnZtief20

>>379
8割方はどうでもいいコピペまとめなんだけど、これを個人サイトみたいに使ってる人や、真っ当な有益情報をまとめてくれてる人もいるんだよね
そういった情報が消えるのはもったいないし、今後困る人がいそう

381192.168.0.7742020/07/03(金) 22:23:28.54ID:0J0hhHF10

来年から新しい著作権法が施行されるらしいけど、
ウェブ魚拓とかの古いデータが、削除されたりしないか少し心配

382192.168.0.7742020/07/03(金) 23:54:06.51ID:pnZtief20

ウェブ魚拓は削除申請来たらバンバン消してるらしいから今更感ある
archive.todayやInternet Archiveは著作権の前にサーバ処理が追いつくのか心配

383192.168.0.7742020/07/04(土) 13:35:00.45ID:inafeRIM0

>>382
同意

384192.168.0.7742020/07/08(水) 22:28:06.73ID:JMicZAgO0

NAVERまとめだけじゃ無くLINEノベルも終了か…
ソフトバンクグループ特有のサービス終了ラッシュ

385192.168.0.7742020/07/09(木) 01:28:23.13ID:c1obRcGo0

へー、ソフバンは避けよう

386192.168.0.7742020/07/09(木) 03:09:48.75ID:K/ssIawO0

朝鮮系は避けてたから掠りもしないw

387192.168.0.7742020/07/09(木) 07:32:19.74ID:qxukY3NX0

ヤフーと合併するってことはこういうことだ
米国のヤフーがその典型で、買収した企業やサービスはことごとく閉鎖させてるしね

388192.168.0.7742020/07/09(木) 08:42:41.16ID:c1obRcGo0

潰したい企業を買収してからわざと潰すっていう性格の悪い投資家の話聞いたことがあるけど
まさかヤフーがそれだったりしないよな

389192.168.0.7742020/07/13(月) 15:08:26.85ID:JeHTcZXr0

>>384
うーんこの

390192.168.0.7742020/07/14(火) 15:25:35.44ID:bp/ba6L20

>>351
変則将棋とかのニッチすぎるカードゲームやボードゲームのサイトもだね

391192.168.0.7742020/07/15(水) 12:36:07.34ID:6KInjDIb0

保存する価値が特に高いサイト
（時間が経っても役に立たなくなることがまずないため）

レビューサイト
ゲーム攻略サイト
ボードゲーム・カードゲーム関係（ただしTCGなどは除く）
タロット占いなどの占い系
料理レシピ・裁縫などの家事系

392192.168.0.7742020/07/16(木) 02:27:44.38ID:okkeNa+i0

ウェブ小説サイトとかも

393192.168.0.7742020/07/17(金) 17:41:35.04ID:iWA6pxH10

旅行・探検系も含めていいかも
あと災害etcで現存しない場所の訪問記とか

394192.168.0.7742020/07/18(土) 01:13:41.89ID:MoAmN+OG0

昔のイベント体験記もだな

395192.168.0.7742020/07/18(土) 01:27:31.30ID:MoAmN+OG0

ついでに暇つぶしにネット検索してたら
ocn1.netなるサイトを発見した

396192.168.0.7742020/07/18(土) 02:15:45.46ID:HI8FU48P0

>>395
https://www.google.com/search?q=site:ocn1.net&;lr=lang_ja&newwindow=1&hl=ja&tbs=lr:lang_1ja&sxsrf=ALeKk03M6bSG2JwS_U8icd02MQFRuM0Vsg:1595006071724&ei=d9wRX__qK7KCr7wPofi7mAQ&start=200&sa=N&ved=2ahUKEwi_gsfS5NTqAhUywYsBHSH8DkM4ZBDw0wN6BAhlEDQ&biw=944&bih=1083

397192.168.0.7742020/07/18(土) 14:45:04.72ID:42EZKBGK0

>>391-394
こういうサイトを優先的に保存すべきだな

398192.168.0.7742020/07/19(日) 04:44:14.87ID:lFOHvKxW0

こういう魚拓系サイトってエロ動画とか保存いけんの？

399192.168.0.7742020/07/19(日) 14:44:03.36ID:5VoHw/dK0

ocn1.netってサーバー名だったのかサイト名ではなかったのか
キューブのへやは一通り保存しといたけど他にもいっぱいあるやん

400192.168.0.7742020/07/21(火) 21:19:19.64ID:iEzABfS/0

2020年8月31日（月）サービス終了
暮らしのレシピ投稿サイト「 nanapi 」
https://nanapi.jp/

料理：約11000ページ
ライフハック & 雑学系：約8000ページ

暮らしの情報サイトnanapi終了のお知らせ
https://nanapi.jp/info/9
Twitter @nanapi
https://twitter.com/nanapi
https://twitter.com/5chan_nel (5ch newer account)

401192.168.0.7742020/07/22(水) 00:43:31.60ID:Qv2V5tOA0

>>400
保存する価値が高いな

402192.168.0.7742020/07/22(水) 06:22:06.26ID:5ZyfxxsF0

検索サイトにアーカイブが引っ掛かる又はWeb Archiveに保存されてる以外だと実質的な消滅に等しい

403192.168.0.7742020/07/25(土) 12:03:11.28ID:vPQBVdbR0

> お知らせです。Neverまとめ終了に伴い、【実走！酷道・険道のまとめ】についても、終了させることにしました。
>2013年以来、約7年間のご利用有難う御座いました。
>道路ネタについては、引き続きツイートしていきます。どうぞ、宜しくお願いします。
twitter.com/kendou774/status/1286852266280890368
https://twitter.com/5chan_nel (5ch newer account)

404192.168.0.7742020/07/25(土) 20:28:57.46ID:op0juaWZ0

ウェイバックでアーカイブしたNAVERまとめ記事でページ移動しようとすると
URLにgrid=falseっていうパラメータが追加されるみたい
誰か原因わかる人いる？
このせいでせっかくアーカイブしても2ページ目以降が参照できない問題が起きてしまう

405192.168.0.7742020/07/25(土) 23:03:50.67ID:vPQBVdbR0

>>404
自分が取ったアーカイブはそんな症状は出てないな
その問題が出たアーカイブのURLを教えてくれんか

406192.168.0.7742020/07/26(日) 00:15:07.54ID:6TmDXbEI0

>>405
例えばこのまとめのアーカイブ
2159020990876963301

2ページ目のボタンを押すとこのページに移動してエラー
2159020990876963301?page=2&grid=false

何度か試すと通常通りのページが表示される時もあるようで、今一どういう条件で発生するのかわからない

407192.168.0.7742020/07/28(火) 01:55:57.75ID:GOjmQFzm0

>>406
そのまとめではエラーにならなかったが、別の複数のまとめでエラー発動したわ
条件は全然分からないな

408192.168.0.7742020/07/31(金) 18:21:02.96ID:hz5s2lhM0

最近/save/の後にURLつけてブラウザで踏んで保存しようとするととんでもなく時間かかるようになってるんだけど
もっと早く保存する方法ないかな

409192.168.0.7742020/07/31(金) 19:38:16.52ID:gaCi8uhU0

>>408
同じく
しかもちゃんと保存できてるかどうかも怪しい

410192.168.0.7742020/07/31(金) 20:26:07.21ID:TTL90URn0

これ使えんの？
175 名前：py ◆o3kzHb/in8w0 [sage] 投稿日：2019/05/14(火) 19:06:58.64 ID:cP8wStLG0
https://u1.getuploader.com/irvn/download/1657
web2IAWBM.dms ver0.000.007　WayBackMachineに保存　(web.archive.org) 2019/05/14

web2IAWBM.dmsはIrvineとDorothy2を使ってInternet Archive WayBack Machineに自動登録(保存)するためのスクリプトです。
自動で全てのリンクをたどって保存してくれるはずです。
web2IAWBM.dmsは素人が作った物なので至らない点も多々ありますが、
一応使える水準になったと思われるので公開します。
無料のウィルススキャンはしましたが、念のためもう一度スキャンされることをお勧めします。
同梱のDorothy2(の一部)は別の方が作った物です。
■ Irvine初回起動前に必ず jwordフォルダを削除してください。■

動作試験環境：windows10pro　Irvine1.3.1

411192.168.0.7742020/07/31(金) 21:15:44.33ID:x6UEbNzr0

>>410
自分で使ってみては？
レビューしてくれ

412192.168.0.7742020/07/31(金) 22:16:46.71ID:BOBaNxn40

>>411
>>408-409
へのレスしたつもりなんだけどね
誤解させてごめんねｗ

413192.168.0.7742020/07/31(金) 22:59:42.22ID:x6UEbNzr0

>>412
理解した

このところ/save/にURL繋げて直接保存させるのやってないから分からんけど、
ブラウザのsave page nowのフォームから保存するときとは色々処理が違うのかもね
最近Waybackの調子が特に良くないらしいから多分サーバ自体の問題だとは思うけど

414192.168.0.7742020/08/02(日) 02:59:54.76ID:BxGk29Xt0

Naverまとめを色々漁ってたらネット上で出回ってるコラの元画像・出典を集めたやつがあった
単なる宣伝まとめに完全汚染される前は、こういう地味だけど役立つまとめを書く人がそこそこいたんだけどな...
00年代から10年代のインターネットの残滓みたいな側面もあっただけに惜しい話だ
ArchiveTeamにどうにかして持っていきたい

415192.168.0.7742020/08/04(火) 10:42:23.62ID:kQccth3l0

昔のエロゲーとか普通の深夜アニメとかの公式サイトで保存されていないページが時々ある

416192.168.0.7742020/08/07(金) 14:35:38.67ID:SiHrQHil0

Googleマップの埋め込みはArchiveTodayで録れる

417192.168.0.7742020/08/15(土) 19:40:30.73ID:PMZXDU5C0

>>398
無理じゃね？

418192.168.0.7742020/08/16(日) 20:27:14.92ID:98xsFRfG0

ストリーミング配信のクロールは技術的に結構難しい

419192.168.0.7742020/08/16(日) 20:27:47.53ID:98xsFRfG0

動画を保存するならメタデータを含めた上で普通にダウンロードした方がいい

420192.168.0.7742020/08/18(火) 18:55:08.22ID:e28RrLlN0

トップページは見れるけど細かい中身までは保存されてないのか見れないことが多いわね　特に画像や動画は死んでる

421192.168.0.7742020/08/18(火) 21:04:20.75ID:xoxZKMa90

さくらインターネット専用サーバ
2020年11月30日で全て終了

422192.168.0.7742020/08/18(火) 23:33:08.82ID:FetPd1Vj0

>>421
古い専用サーバだけが対象

>この度、1997年6月より提供開始した「専用サーバ」および2007年1月より提供開始した「専用サーバ　Platform Ad / St」につきまして、
>2020年11月をもちまして、サービスを終了いたします。
>これらサービスは、サービス開始から10年以上の期間が経過しており、今後、保守部材の確保ができず、サービス継続が困難な状況でございます。
>さくらの専用サーバ（2012年2月提供開始～現在申込受付）」はサービス終了の対象ではございません。
https://server.sakura.ad.jp/dedicated_server_end/

423192.168.0.7742020/08/19(水) 17:14:03.56ID:iZ5+0Ecr0

>>422
既に消えてるページあるよ
エロゲの回想未収録エロを個別セーブデータで対応してくれてたサイトとか
まあｌｚｈの脆弱性騒動でｌｚｈ書庫セーブデータはｓなしｈｔｔｐ，ｘｐ，ｗｉｎ７締め出しみたいにサーバ側に既に全消去されてたけど
ｈｔｔｐ：／／ｄａｉｄｏｋｏｒｏ．ｓａｋｕｒａ．ｎｅ．ｊｐ／ｄａｔａ／ｅｒｏｇｅ＿ｄａｔａ．ｈｔｍ
ｈｔｔｐ：／／ｗｅｂ．ａｒｃｈｉｖｅ．ｏｒｇ／ｗｅｂ／２０１８０４３０１１２９４６／ｈｔｔｐ：／／ｄａｉｄｏｋｏｒｏ．ｓａｋｕｒａ．ｎｅ．ｊｐ：８０／ｄａｔａ／ｅｒｏｇｅ＿ｄａｔａ．ｈｔｍ

NGワード引っかかったから、気になるなら半角にテキストエディタかなんかで変換して

424192.168.0.7742020/09/06(日) 17:22:46.19ID:CBf1XfYV0

サービス終了のお知らせ

長らくのご利用まことにありがとうございます。
大変恐れ入りますが、当サービスは2020年９月末をもって終了させていただきます。
mobile space

携帯(ケータイ)無料ホームページ提供フリーサイト「MobileSpace（モバスペ）」
http://m-space.jp/

425192.168.0.7742020/09/07(月) 12:06:40.69ID:3OpmkuSp0

Naverまとめのバックアップしてる有志いないかー？
自分も最近バックアップしてるんだがURL集めとかどこにすればいいかわからない

426192.168.0.7742020/09/07(月) 15:14:13.63ID:3OpmkuSp0

>>404
それはしゃあない、NAVERまとめは2ページ以降のURLも規則的だから、そこは見る側がインターネットアーカイブからURLをいじってアーカイブを見る方法しかないと思う
2ページ以降のURLがわかる以上アーカイブするにあたってそこまで気にしなくてもいい

427192.168.0.7742020/09/08(火) 03:14:53.75ID:rgMOAV4l0

>>397
同意

428192.168.0.7742020/09/08(火) 22:10:50.40ID:+a/fwcct0

将来役に立つか分らんけど書いとく
Naverまとめは2ページ目以降のURL末尾が
①: ?page=ページ番号
②: ?&page=ページ番号
の2パターンあるので注意
通常であれば2ページ目→①、3ページ目以降→②のパターンで保存されてるはず（だが例外もある）
あとはこの辺 >>404 >>406

429192.168.0.7742020/09/09(水) 08:08:33.67ID:iGXkHt4n0

とりあえず作ったからURL集めここにしないか？
NAVERの終了近づいてるから立てといた
https://jbbs.shitaraba.net/internet/25479/

5chだと多量URLは規制くらうし、かといっていちいちGeoLogみたいなURL集め場作るのもあれだし
したらばはGoogle検索ひっかかるししたらば自体もアーカイブできるから万が一にも備えられるしURL保管庫としては優秀
後から集めたURLにタイトルつけてスレ立てすれば後世代の人がググって見つけられる可能性が出てくるのが大きい
他にサービス終了候補出たらここにスレ立ててURL集める感じで

430192.168.0.7742020/09/09(水) 22:03:15.69ID:GaAB5Js70

>>429
乙
汎用的に使えるし次スレからここのテンプレに入れた方がいいな

>>429は念の為にトリップ付けてしたらばと5ch両方に書き込んでおくと良いかも
したらばと5ch(&おーぷん2ch)とではトリップの生成アルゴリズムが違うらしく同じ名前でも違うトリップになるけど、とりあえずでも管理人だという証明がある方が何かと安心だしね

431◆Oddz6L15vQ 2020/09/09(水) 22:23:41.61ID:iGXkHt4n0

>>430
OK、付けておく

432192.168.0.7742020/09/10(木) 17:58:45.52ID:lCL9EyAY0

150万記事くらいURLかき集めてタイトルとページ数もセットで保存してあるよ
ArchiveTeamにも先月渡したんだけどどうやら忙しいらしくて動きがない

433192.168.0.7742020/09/10(木) 20:34:28.12ID:S0dI6L/m0

>>432
ArchiveTeamに渡すってことはインターネットアーカイブには保存できてないってこと？

434192.168.0.7742020/09/11(金) 15:17:14.37ID:FY5rw0Vj0

>>433
ArchiveTeamが保存したサイトはWayback Machineにアップロードされて、最終的にちゃんとInternet Archiveに保存される仕組みになってる

435192.168.0.7742020/09/11(金) 15:43:42.84ID:FY5rw0Vj0

>>432
150万はすごいな、何を使って収集したのか気になる
あとArchiveTeamとのコンタクトってどうやって取ったん？
サイトの説明を色々読んでるけど窓口が見つからない

436192.168.0.7742020/09/11(金) 17:53:04.83ID:vIEy03BU0

>>434
いや、そういう意味ではなくArchiveTeamの動きないってことはインターネットアーカイブに保存できてないんじゃないかってこと
もしインターネットアーカイブに現時点で保存できなくて、ArchiveTeamに動きなければ>>432がローカルで保存できてない限り9月30日を迎えたらそれも無駄になる

437192.168.0.7742020/09/11(金) 18:38:50.57ID:FY5rw0Vj0

>>436
なるほどな、確かにArchiveTeamに動きがなかったら保存されないね

ArchiveTeamが今どういう状況なのかがよく分からないんだけど、本当にNAVERまとめは一切手付かずなのかな？

438192.168.0.7742020/09/11(金) 19:41:43.80ID:vIEy03BU0

>>437
いろいろ保存してるけど本当に2ページ以降はクロールされてないよ
クローラーの仕様でGoogle検索に出る1ページだけは保存されるけど
だから人力で保存されてる記事はあんまりないね

439192.168.0.7742020/09/12(土) 09:44:43.85ID:+xgSs3Ql0

>>438
もう自分でクローラソフト動かしてローカルに保存した方が安心じゃね？
ネットのデータなんて今じゃいつ消えるか分からない
もうバックアップのバックアップ（調子悪くてバックアップ後に取り外したHDDに入れっぱなしのデータ等）くらいのオマケ

アーカイブサイトに保存して安心してたら見られなくなってて、
txtでちょっとメモした断片的情報しか手元に残ってなくて絶望したわ

440192.168.0.7742020/09/12(土) 12:00:07.88ID:G5q1lmCg0

>>439
確かにそれもそうだし愛読書のごとく読むようなウェブページはpdf化してるけどさ
やはりローカル保存じゃ限界がある、数万記事とか保存しようものならHDD持たないし
それにアーカイブに保存する理由はみんなが見れるからね、知恵袋や古い2chの過去ログ見ててそこのリンクがリンク切れになっても大丈夫なようにある
インターネットアーカイブが消えるときってやっぱり削除要請に応じてるからなのかな
今のところ自分で保存した記事で消えた経験はないが、削除要請以外の自動削除はないと信じたい

441192.168.0.7742020/09/12(土) 12:06:20.24ID:G5q1lmCg0

ちなみにArchivetodayや他の魚拓サイトは個人経営らしいから経営者が死んだらサーバー更新できず見られなくなるから、そこに大事なものがあればローカル保存したほうがいい、数十年後に見られなくなってる可能性あるし
やはり数百年後の人類に情報を残すなら法人経営のインターネットアーカイブ

442192.168.0.7742020/09/12(土) 14:19:44.63ID:smUg5j0l0

>>439
そうなんだよなあ
前にインターネットアーカイブで閲覧してた削除済みのサイトが
「This URL has been excluded from the Wayback Machine」で
見られなくなってしまってローカルに保存していなくて今も後悔してるわ
前は見られていた分ショックがでかい

こういうのってドメイン再取得した人が解除申請出すしかまた見られる
方法ないのかね？
これって「完全に削除」されたわけじゃなくて単純に「除外」された状態らしいから

443192.168.0.7742020/09/12(土) 19:09:30.26ID:G5q1lmCg0

>>442
除外したってことはやっぱりサーバーの容量不足とかじゃなくて要請に応えただけか
サービス終了とかじゃなくてそのページがあると都合が悪いからって意図的に消してるのはローカル保存しかないと思うよ
俺は何回も読むサイトは1ページだけならpdf化してる
さすがに保存対象のURLが何個もあるサイトを全部やるのは面倒だけど
ドメイン再取得していけるかはわからんけど管理者であったことを証明しないとさすがに難しいんじゃないか？でも今の管理者ではダメとも限らないしなー

444192.168.0.7742020/09/12(土) 19:14:06.20ID:GdLneOCP0

>>443
クローラソフトで.mhtやindex.html等で階層いくつ潜るか設定してクロールすればいいじゃん

445192.168.0.7742020/09/12(土) 19:35:49.12ID:smUg5j0l0

>>443
>>444
微妙なラインだよなー
ぶっちゃけるとそのサイトはジオシティーズドメインのページで、ジオシティーズの
ＵＲＬは普通にアーカイブ何万も保存されてて見られるんだけど、そのドメインのサイトは
除外されてるんだよな
自分はそもそもの管理者じゃなくてそのページのファンで、もしまた見られるなら
自分が読んで楽しみたいだけなんだけど、やっぱ厳しいかもしれんな

446192.168.0.7742020/09/14(月) 03:08:56.33ID:W68LNMti0

ArchiveTeamがNAVERまとめのアーカイブ作業に取り組み始めてくれてたみたい
進捗はわからないけど、これでひとまず安心かな
漏れもあるだろうから重要なページは各自で保存する必要があるけどね

>>435
pythonでスクリプト組んで収集した
ArchiveTeamはIRCを使って活動してる
サイトの#から始まるリンクをクリックすれば各プロジェクトに対応したチャットルームに行けるよ
コマンド入力でクローラ操作してる人がいるArchiveBotの部屋が活発なイメージ

4474352020/09/14(月) 04:11:09.04ID:Np2NU3M80

>>446
なるほど、どうもありがとう
ArchiveTeamが動いてくれたなら最悪の事態は避けられるはずだな...
もちろん>>432(446)の収集したURLあってこその事だから自分も見習わないといけないが

4484462020/09/14(月) 11:29:54.09ID:sR0ATY0Y0

NAVERまとめデータ共有
csvデータ（URL, ページ数, タイトル）記事数:1472709, 更新日昇順, 192 MB
https://web.archive.org/web/20200913150754if_/https://transfer.notkiska.pw/r9mfn/NAVER_matome_article_list.csv

※収集後に更新されたことでタイトル、ページ数が異なったり削除されていたりする可能性あり
トピック一覧ページから収集したからトピックが設定されてない記事は１つも収集できてない

449192.168.0.7742020/09/14(月) 15:27:58.62ID:Np2NU3M80

>>448
503エラーのページがアーカイブされているんだが

450192.168.0.7742020/09/14(月) 15:30:52.44ID:fWxNFkB80

ごめんなさい。恥ずかしいのですがarchiveteamって何ですか？

451192.168.0.7742020/09/14(月) 15:32:16.47ID:Np2NU3M80

Wayback Machineが一時的に落ちてただけだった
何回かリロードしたらちゃんとダウンロード出来たわ、すまん

452192.168.0.7742020/09/14(月) 15:36:10.18ID:Np2NU3M80

>>450
ウェブアーカイブを組織的にやってる(おそらく非営利の)団体
ArchiveTeamが保存したコンテンツはInternet Archiveで公開される仕組みになってる
正直に言うと自分もArchiveTeamの公式サイトを読んでる途中だから、具体的な活動の様子とかはちょっとわからない
https://ja.wikipedia.org/wiki/Archive_Team
https://www.archiveteam.org/

453192.168.0.7742020/09/17(木) 17:02:04.46ID:/9nSrgLL0

【ネット】1000万件以上の研究論文がオンライン上から消失することを防ぐインターネットアーカイブの取り組みとは？　 [すらいむ★]
http://2chb.net/r/scienceplus/1600244016/

454192.168.0.7742020/09/24(木) 21:11:36.87ID:kg/LREFg0

Braveの機能を使って少額寄付した

455192.168.0.7742020/09/25(金) 12:26:47.34ID:Cm7cjbfH0

>>454
Braveいいよね特にスマホ
ポイントサイトで乞食活動やるよか割もいいし

456192.168.0.7742020/09/28(月) 05:48:18.46ID:ydgdSdUA0

今更NAVERまとめをローカルに落とそうとしているのだが
Website Explorer・WinHTTrack・Cyotek WebCopy
はうまくいかず(設定ミスがあるのか？)

NAVER＆FC2まとめダウンローダ
http://shimarisu.webcrow.jp/naver_matome.html

は画像もhtmlも一応取れるのだがhtmlにダウンロードした画像
はリンクされてない。
後はmhtとpdfぐらいしか無く……

他の人はどのようにローカルに落としているのでしょうか？

457192.168.0.7742020/09/29(火) 11:41:45.96ID:IYXlvscX0

そもそもローカルに落としてないな...
Wayback Machineに頼ってる

458192.168.0.7742020/09/30(水) 00:31:14.62ID:6Ozi/51l0

Naverまとめはほぼバックアップされてるっぽいから安心した
ただNaverのトピックのアーカイブの表示がいろいろおかしい、まったく違う記事名出たりする
どうやらNaver側はURLの大文字と小文字を区別してるのにウェイバックマシン側では区別してないから発生するバグっぽい
トピック見れなかったら別の時間のアーカイブ参照すると見れることがある
例えばトピックのIDがaaabbの場合IDがAaaBbやAAABBの別トピックもウェイバックマシン側がaaabbとして扱うから収集された時間で記事が混在する
2ページ以降のトピック表示は2ページ目の存在による
aaabbにだけ2ページ目以降が存在すればaaabbしか表示されない、他のIDにもあると2ページ以降も混在状態になる
aaabbに2ページ目がなくてAaaBbにある場合もURLいじったりして2ページ以降行くとAaaBbの2ページ目が表示される
NAVERまとめ共有データの中を特定のワードで検索してそこのまとめにアクセスして所属トピック押せばある程度好きなトピックに飛べるから有効に使えると思ったけど少し難ありか
記事にはまったく関係ないから大丈夫、トピックURLが英数字5文字で大文字小文字の違いで別ID扱いされる仕様により起きてるだけだから
記事の中身のURLで個別化されている部分は全部数字だから大丈夫

459192.168.0.7742020/09/30(水) 14:43:23.75ID:g0DIZp7G0

ツイッターを見ているとNAVERまとめがなくなったことを喜んでる人結構多いし、
何なら「あんなの保存しとく価値はない」みたいな意見も見受けられる
でも、アーカイブが必要かどうかを判断するのは現在生きている自分たちじゃなく将来の人々だと思うんだよね

自分もYahooブログが終わった時は「あんなの保存したってしょうがないだろう」と思っていた側だったんだけど、サ終してしばらく経ったある時、
自分の専門分野に関するとある重要な記録がYahooブログ上で公開されていたらしいこと、
なおかつブログ主が亡くなっていて再公開の見込みもないこと、
そしてどこにもそのアーカイブが残っていないらしいことが判明して、かなり後悔した事があった
これはあくまで一例に過ぎないけども、とにかくWebアーカイブを取る必要があるかどうかは取る側の人間ですら判断できるものじゃないんだと思うわ
長文＆自分語りすまない

460192.168.0.7742020/09/30(水) 14:52:44.90ID:g0DIZp7G0

しかしまあNAVERまとめをブログ代わりに使ってた人結構多かったみたいだな

461192.168.0.7742020/09/30(水) 15:31:27.75ID:aEbDHVq00

>>459
バカッターなんて結論決まってて後押し（確証バイアス）がほしい時だけ見るもんだよ
今回のなんて馬鹿は想像力も共感力も低くて他人の痛みが分からないから見るだけ無駄だったわけだし

462192.168.0.7742020/09/30(水) 17:47:30.32ID:g0DIZp7G0

>>461
確かにそれはそういうものなのかもしれないな

463192.168.0.7742020/10/04(日) 01:53:55.83ID:t5NF2s3S0

ArchiveTeamのリソースほんとすごいな...

464192.168.0.7742020/10/05(月) 21:28:33.39ID:PD0n9p530

「Webスペース」　サービス提供終了について
https://www.so-net.ne.jp/info/2020/op20200908_0039.html

平素はSo-netをご利用いただき、誠にありがとうございます。

このたび、誠に勝手ながら、2021年1月28日(木)をもちまして、「Webスペース」サービスの提供を終了させていただくこととなりました。

465192.168.0.7742020/10/05(月) 21:28:48.86ID:PD0n9p530

https://www.so-net.ne.jp/option/upp/
U-page+は、2021年1月28日（木）15:00 にサービスの提供を終了します

466192.168.0.7742020/10/06(火) 12:42:46.60ID:phjE2/zo0

so-netが終了したらまた古のインターネットが色々消えるな

467192.168.0.7742020/10/06(火) 22:52:50.75ID:DBLhvSyO0

So-netブログはSeesaaに成ったからブログ以外か…

468192.168.0.7742020/10/07(水) 04:16:18.40ID:dojvgnQy0

自分のブクマに入ってたのはこれくらいだな
埋もれてるけど価値があるページはかなり沢山ありそうな気がする
http://www002.upp.so-net.ne.jp/jsrc/dust/eva.html
http://www004.upp.so-net.ne.jp/anubis/index.html
http://www004.upp.so-net.ne.jp/upc/
http://www004.upp.so-net.ne.jp/kuhiwo/dazai/index.html

469GeoLog Project ◆RJRIJK3wcLw8 2020/10/11(日) 16:23:42.66ID:wq/dYYyR0

so-netのURL収集を始めることにしました
知っているURLがあれば追加してください
現時点でユーザー名単位で2万程度、個別URLでは300万くらいDBに入ってます

https://geolog.mydns.jp/so-net/

特にJavaScript等から呼び出されるファイル群は網羅が難しいので、何か良い手があれば

470◆sOHUy6jdA4II 2020/10/13(火) 01:07:49.82ID:y1bzU/4u0

>>469
日本語版ウィキペディアの外部リンクから2000個ほど抽出したんですが、スクリプトでの送信とかって受け付けてます？
(既に収集済みのものとだいぶ被りがありそうですが)

471GeoLog Project ◆RJRIJK3wcLw8 2020/10/13(火) 19:39:50.63ID:5fIpkaAP0

>>470
特に制限はしてないですが、処理速度的に現実的ではない気がするので、
フォームを改行区切りで複数受け付けられるように直したいと思います

472GeoLog Project ◆RJRIJK3wcLw8 2020/10/13(火) 22:03:48.69ID:5fIpkaAP0

>>470
複数行投入できるようにしました

473192.168.0.7742020/10/13(火) 23:27:30.09ID:vjEziSOV0

geocitiesのときはそれなりに貢献できたけど今回はブクマ見てもso-netなかったわ・・・

474あめ ◆P0jSlC5fJs 2020/10/18(日) 05:37:28.91ID:SRaefsBF0

【告知】ニコニコ動画のコメントサーバーリニューアルについて
https://blog.nicovideo.jp/niconews/141893.html
> マイメモリー機能の提供を終了
> ・マイメモリーの新規作成や、既存マイメモリーの視聴ができなくなります
> 削除された動画へのコメント投稿とコメント表示の終了
> ・動画タイトルや説明文などの情報も表示されなくなります

期限は「2021年の春までに実施」とのこと

475192.168.0.7742020/10/18(日) 15:46:35.08ID:kWrTLNjS0

削除済み動画を全部リストアップして、動画説明文/タイトル/コメントなどの情報を取得していく感じか
コメントに関してはXML形式で取得する手法があったような気がする
マイメモリー機能は使ったことないから分からん

476192.168.0.7742020/10/18(日) 15:47:20.86ID:kWrTLNjS0

sm1から順に数字をカウントアップしていけばいいのかな

477192.168.0.7742020/10/19(月) 19:56:27.93ID:PssRg44Z0

>>472
検索で引っかかったサイトは送信した
WaybackMachineにも保存できないかな

478192.168.0.7742020/10/20(火) 00:42:22.74ID:U91haJxZ0

モバイルサイトのないサイトは来春インデックスから消える？ Googleアナリストが明言
https://internet.watch.impress.co.jp/docs/yajiuma/1283657.html

479192.168.0.7742020/10/20(火) 18:21:05.26ID:eWiUZHxk0

>>478
Google検索なんて糞化が酷くてもう使ってないからどーでもいい

480192.168.0.7742020/10/20(火) 23:29:11.48ID:Puq2k3e00

世界一使われてる検索エンジンだしな
個人の好みとしてはGoogleが何をしたってどうでもいいとしても、
影響力を考えると決して無視はできないよ

481192.168.0.7742020/10/21(水) 03:05:19.74ID:2kIOGutW0

数年前からネットサーフィン＝スマホに成ったからなぁ…

482192.168.0.7742020/10/21(水) 18:11:15.59ID:le0ESoNU0

Google 絶対じゃなくなったんであまり件数ヒットしない検索ワードは Bing や Yandex 併用だよ。

483192.168.0.7742020/10/21(水) 22:24:10.23ID:Yfu1DTmm0

DuckDuckGoで出ない時だけGoogle

484192.168.0.7742020/10/23(金) 16:57:51.30ID:qVAboCuj0

>>477
誰かがArchiveTeamにURLリスト渡してくれれば多分保存できる
NAVERまとめの時はアーカイブ開始までに1ヶ月くらいかかったから保存したい場合は早めに相談したほうがいいかも

485192.168.0.7742020/11/03(火) 09:39:05.85ID:q2UfgLtS0

wgetでWARC.GZファイルを書き出したとき画像ファイルとかも格納される？
どなたかご存知だったらお願いします

486192.168.0.7742020/11/04(水) 22:28:08.38ID:iEXbTPK90

>>485
WARCは画像ファイルや音声ファイルも含めてページを丸ごと保存する仕組みになっているから、
--page-requisitesオプションを付けて確実に画像がダウンロードされるように指定すれば、ちゃんと画像が格納されるはず

487192.168.0.7742020/11/04(水) 22:30:48.96ID:iEXbTPK90

WARCの概要を解説してる日本語サイトをいくつか貼っておく
https://warp.ndl.go.jp/contents/reccommend/mechanism/mechanism_warc.html
https://qiita.com/mugwort_rc/items/459d4872168e2cc28ba1

488192.168.0.7742020/11/05(木) 16:18:21.95ID:bSeXiffE0

>>487
ありがとです
--page-requisitesがうまく反映されてなかったみたいでした

489192.168.0.7742020/11/05(木) 17:30:05.38ID:M9nLXqV10

コロナ騒動の最中に消えていったお店のサイトも手動で保存している。

490192.168.0.7742020/11/08(日) 00:21:48.98ID:c3JWvanA0

「Infoseek」一部サービス終了のお知らせ（11/2追記）
https://plaza.rakuten.co.jp/usersupport/diary/202008210000/

Infoseekトップページ変更、翻訳、辞書が終了

491192.168.0.7742020/11/22(日) 08:30:10.87ID:q2CdPGCc0

>>469 を使ってみた
URLをページ内検索で探したらなかったのに、送信するとDBにあると出た...
ページ内検索がダメなのかな
あと、文字化けしているところがあるけど大丈夫なのかな

492GeoLog Project ◆RJRIJK3wcLw8 2020/11/22(日) 13:39:23.43ID:nA7b/lhh0

>>491
どのURLでしょう？

ロジック上は文字コードを考慮していないので、文字化けはそのせいかもしれないです
一応UTF-8のはずなんですが

493192.168.0.7742020/11/26(木) 12:16:05.64ID:8QHBEnW70

https://archive.st が全然取れなくなってしまった

494192.168.0.7742020/12/04(金) 19:50:57.91ID:UDGmJ95l0

>>493

復旧した？

495192.168.0.7742020/12/04(金) 21:37:24.55ID:Onk8N+kv0

そこってサイトによって取れたり取れなかったりしない？

496192.168.0.7742020/12/05(土) 10:13:49.51ID:jr20iitY0

>>493
そこって消える前のフリーウェアとかアーカイブ出来ないクソじゃね

497192.168.0.7742020/12/10(木) 20:48:32.73ID:vQ+C+6Ux0

>>496
自分の目的が果たせないものをクソ扱いするのは幼稚だからやめような
フリーウェアはInternet Archiveに持っていくとか、
証拠に使うから削除されたくないものは削除申請が通りにくいarchive.today使うとか、
各サービスを使い分けるのがより無難だよ

498192.168.0.7742020/12/12(土) 15:13:48.12ID:ELOCcQrr0

「Yahoo!ライフマガジン」サービス終了のお知らせ
この度「Yahoo!ライフマガジン」は、2021年3月31日（水）をもちまして、サービスを終了させていただくことになりました。
記事コンテンツは、引き続き「Yahoo! MAP」アプリ上でご覧いただけます。
これまで長きにわたりご利用いただき、ありがとうございました。

499192.168.0.7742020/12/14(月) 04:34:30.82ID:h53jvyxt0

chakuwiki存亡の危機

友人との永遠のお別れ
https://midorikawa.themedia.jp/posts/10408887/

運営していた谷口一刀さんが8月に亡くなられた事により
12月にドメイン名でのアクセスが不能になった。
(IP https://52.69.139.163/ では可能)

遺族は存続に消極的みたいな模様。

バックアップはしてみたいものの
かなりの容量だと思われるからなあ～
どのぐらいの大きさなんだろうな。

500192.168.0.7742020/12/14(月) 06:32:22.27ID:9FaOalLE0

もっと早く情報投げて貰えればドメイン失効前にどうにか出来たのに

501192.168.0.7742020/12/14(月) 07:41:39.26ID:gA+U1PtW0

>>499
https://chakuriki-alb-971307490.ap-northeast-1.elb.amazonaws.com
も可能

502192.168.0.7742020/12/14(月) 14:54:55.41ID:9FaOalLE0

ChakuwikiってMediaWikiだったのか
それなら一応記事のエクスポート機能があるから、これに頼るのが現実的かな
https://www.mediawiki.org/w/index.php?title=Help:Export/ja

503192.168.0.7742020/12/14(月) 16:04:34.06ID:gA+U1PtW0

>>502
[[特別:統計]]によると記事だけで17,306個もあるみたい
Botとかで一度にエクスポートできるの？

504192.168.0.7742020/12/14(月) 16:08:04.03ID:gA+U1PtW0

>>503
勘違いしてた。一度にできる方法があるのか

505192.168.0.7742020/12/14(月) 16:32:18.01ID:9FaOalLE0

chakuwikiスレにこのスレッドのURLを書くだけ書いてきた

506192.168.0.7742020/12/14(月) 17:13:49.04ID:evtrCVrO0

みんな有能やん

507192.168.0.7742020/12/14(月) 17:25:23.30ID:4RCQuIfW0

archive teamにwiki保存担当のwiki teamってのがあるからそこで事情を話せば多分保存してくれる

wiki teamのチャットルーム
https://webirc.hackint.org/#irc://irc.hackint.org/#wikiteam

wiki teamについて
https://www.archiveteam.org/index.php/WikiTeam

5085072020/12/14(月) 18:15:31.65ID:4RCQuIfW0

どうなるか分からないけどwiki teamに伝えておいた
今調べてくれてるらしい

509192.168.0.7742020/12/14(月) 19:01:14.69ID:9FaOalLE0

>>508
GJ

5105072020/12/14(月) 19:29:16.39ID:4RCQuIfW0

SSLの問題で通常のwikiのダンプツールが機能しないらしい
詳しい人いますか？

5115072020/12/14(月) 19:38:36.21ID:4RCQuIfW0

すまんアーカイブの準備がある程度できたらしい
wiki team

5125072020/12/14(月) 20:10:05.26ID:4RCQuIfW0

変更になるかもしれないけど今のところChakuwikiのアーカイブ状況は
このページから確認できる (ident: 2ns616z58rh5gawijen5s2foi)
http://dashboard.at.ninjawedding.org/3

アーカイブ対象のURLは https://52.69.139.163/
ある程度時間が経ったらWayback Machineに反映されるよ

513192.168.0.7742020/12/14(月) 20:33:04.32ID:azqdHITb0

乙！

514192.168.0.7742020/12/14(月) 20:33:12.40ID:u61g8tyn0

有能

515192.168.0.7742020/12/14(月) 21:19:05.89ID:v8wPmt2c0

教えて下さい。
Chakuwikiのこのページをアーカイブ化したいんですが、
なぜかうまくいきません。
https://52.69.139.163/index.php/中野_(中野区)
なにかエラーかバグが起きているようなのですが、
回避策はないのでしょうか。

516192.168.0.7742020/12/14(月) 21:26:38.73ID:9FaOalLE0

>>515
Internet ArchiveのSave Page Nowで'Job failed'とか出るということなら、それはInternet Archive側の内部エラーだからどうにもならない

517192.168.0.7742020/12/14(月) 21:27:56.18ID:h53jvyxt0

>>512
アーカイブ対象はIPで保存しているようだけど
Wayback Machineにはドメイン名でアクセスできるのでしょうか？

518192.168.0.7742020/12/14(月) 21:34:23.14ID:9FaOalLE0

>>517
無理なはず
アーカイブをした対象のURLがIPアドレスであるならば、Wayback MachineにもIPアドレスのまま保存されます
chakuwiki側がドメインを改めてIPに紐づけた上で、もう一度アーカイブを取り直すしかないです

519192.168.0.7742020/12/14(月) 22:27:22.40ID:y0BEHrZG0

>>507
archive.org にサイト指定してarchive bot走らせること依頼出来るの知らんかった
ニコニコ実況もできたのかな

520192.168.0.7742020/12/14(月) 22:49:25.71ID:9FaOalLE0

>>515
さっきそのページ試してみたけど普通に取れましたよ
多分chakuwikiかInternet Archiveのどちらかでたまたま内部エラーが起きたんじゃないかと思う

521192.168.0.7742020/12/14(月) 23:07:45.15ID:v8wPmt2c0

>>520
ありがとうございます。
教えてちゃん状態で申し訳ありません。
こちらのページは可能でしょうか。半角記号が間に入ると保存できないということなのかと思いましたが、常にそうでもないようで……
https://52.69.139.163/index.php/玉造_(大阪市)
https://52.69.139.163/index.php/小阪_(東大阪市)
https://52.69.139.163/index.php/仁川_(兵庫)

5225202020/12/15(火) 00:35:35.36ID:Y7gKbm450

>>521
全て保存できてます

507氏の申請により、海外のArchiveTeamという非営利団体がbotをぶん回して現在進行系でアーカイブを取ってくれてます
ArchiveTeamのbotが収集したデータはInternet Archive上に移管されるようになっているので、わざわざ手動でアーカイブ取る意味は薄いです

523192.168.0.7742020/12/15(火) 01:45:51.77ID:L/BURrrN0

やはりArchiveTeamはつよい

524192.168.0.7742020/12/15(火) 03:45:40.17ID:Y7gKbm450

chakuwikiのAWSの契約がいつ切れるか分からない以上、時間との戦いって感じかね
保存対象として読み込まれてるリソースの数は現時点で総計173万個
さすがに1ヶ月後までには終わってると思うんだけど心配だな

525192.168.0.7742020/12/15(火) 07:57:43.86ID:Vnn2vEmu0

>>507
>>522
ありがとうございます。
因みにそのアーカイブサイト上のChakuwikiページはどちらになるか、わかりますでしょうか。

526192.168.0.7742020/12/15(火) 11:39:28.70ID:BgcXnTgc0

>>525
反映される時期は不明だけどWayback Machineから
https://52.69.139.163/ で始まるURLで検索すれば閲覧できるようになるよ
ちなみに保存されたルートはアーカイブされたページの右上にあるAbout this captureを押せばわかる
Live Web Proxy Crawlsは一般人が通常通り手動で保存した場合で、Archive teamとかだったらbot経由で保存されてる
【保存・記録】ウェブアーカイブ総合 Page.01 ニコニコ動画>1本 ->画像>14枚

527192.168.0.7742020/12/15(火) 12:51:45.53ID:K0GtvYEh0

少なくともChakuwiki関係者の誰かがドメイン取って
Chakuwiki.netから52.69.139.163に転送するようにすればつながるのかな？

確かサイト移転どかで転送する際はアーカイブでも転送してくれたっけ？

528192.168.0.7742020/12/15(火) 15:14:02.30ID:Y7gKbm450

>>527
そこまで至れり尽くせりではない
Internet Archiveがドメインの名前解決をしてくれるわけじゃないので、
新しくドメインを取ったところで、52.69.139.163で取られたアーカイブには転送されない

529192.168.0.7742020/12/15(火) 15:23:48.12ID:agHpSR5h0

https://blog.nicovideo.jp/niconews/141893.html
2021年の春までにニコニコ動画の削除跡地の動画タイトル、説明文、コメントが消えるらしいので
どうにかしてアーカイブを取りたい

ただ、保存ツールはNicomentXenoglossiaが使いやすいんだけど、
アクセス制限の関係上1時間で250件くらいしか落とせないから全削除動画を落とすのは現実的じゃない

仕方ないからコメントは諦めて動画タイトルと説明文だけでも視聴ページからアーカイブしたいと思ったんだけど、
今年に入ってから削除動画は非ログイン状態だと一切表示できなくなってるんだよね…
ArchiveTeamはログイン状態でアーカイブすることって出来るんですか？

530192.168.0.7742020/12/15(火) 17:13:19.13ID:Y7gKbm450

>>529
自分はArchiveTeamと直接連絡を取ったことはないので断言はできないけど、
可能な限りの融通は効かせてくれるんじゃないかと思う
とりあえずArchiveBotのIRCで相談してみてはどうだろう、DeepL翻訳やみらい翻訳を駆使すれば英語が無理でも何とかなる
https://archiveteam.org/index.php?title=Internet_Archive
https://archiveteam.org/index.php?title=ArchiveBot

531192.168.0.7742020/12/15(火) 17:55:09.16ID:agHpSR5h0

>>530
ありがとうございます
交渉してみます

532192.168.0.7742020/12/15(火) 18:52:56.51ID:Vnn2vEmu0

>>526
ありがとうございます。
こちらのスレの皆様には本当に助けていただきました。
ありがとうございました。

533192.168.0.7742020/12/15(火) 21:45:39.63ID:/3eTgo780

>>530
今の機械翻訳は優秀だし、日本の教育水準はなんだかんだ高いから、
高校まで真面目に英語やってれば大学でサボってても機械翻訳のおかしなところ微調整で長文も余裕

534192.168.0.7742020/12/16(水) 00:43:03.58ID:ZACL66BA0

このスレへの書き込みのみを見る限り、chakuwikiはこのスレが建ってから初めて大規模アーカイブにまで持ち込めた案件ってことになるのかな
実際に依頼したのは>>507ではあるけど

535192.168.0.7742020/12/16(水) 00:44:24.01ID:ZACL66BA0

でも情報をここに書き込んでくれた>>499がいなかったらそもそもArchiveTeamへの連絡にこぎつけることもできなかった訳だしな

536192.168.0.7742020/12/16(水) 01:04:34.43ID:p+5BPWXT0

連絡しなくてもサイト全体をダウンロードする方法を書いてくれた人もいるのに、
ここの住民は知識だけで人に任せるしかできず、初めからやる気がないんだろ

537192.168.0.7742020/12/16(水) 04:37:34.04ID:ZACL66BA0

>>536
上で書かれてるサイト全体をアーカイブする方法は、主に使ってる技術とサイトの規模の問題で全く使い物にならない
ArchiveTeamは実績も知見も関係各所へのコネもあるところなので、
大規模なサイトを対象にする場合はあそこの力を借りるしかない
こういう言い方はしたくないが、知識もなければ自前でクローラ回したこともない癖にイチャモン付けないで欲しいわ

538192.168.0.7742020/12/16(水) 11:52:40.02ID:vM349Ric0

>>537
個人でやれる事なんてせいぜい大型個人サイトまでだもんね
wikiみたく大勢が集まって作っていくようなのは漏れが出やすいしね

539192.168.0.7742020/12/16(水) 14:39:30.07ID:ZACL66BA0

ジオシティーズもGeoLogプロジェクトが半年くらいかけて収集してたけど、ArchiveTeamはその10倍くらいの量を60%くらいの時間で処理してた記憶

540192.168.0.7742020/12/16(水) 19:10:33.02ID:JSA/MYWc0

>>539
有能すぎて草

541192.168.0.7742020/12/16(水) 23:02:03.61ID:ukZ3LQFO0

>>531
自分も保存したいと思ってた
IRCログだとアクセス間隔を開けないといけないという話で終わっている気がするけどどうなるんだろう‥
とりあえず具体的な日程が出次第即IRC側に報告しよう

542192.168.0.7742020/12/17(木) 12:28:41.32ID:uZBzbV0r0

記事のアーカイブ化
https://52.69.139.163/index.php/Chakuwiki:%E5%80%9F%E4%BA%95%E6%88%B8#.E8.A8.98.E4.BA.8B.E3.81.AE.E3.82.A2.E3.83.BC.E3.82.AB.E3.82.A4.E3.83.96.E5.8C.96

543192.168.0.7742020/12/17(木) 20:15:51.98ID:YcW6IKDX0

お尋ねしたいんですが、Webarchiveで一度アーカイブされていて、
きちんとその状況が確認できていたものが、
アーカイブから消されることってあるのでしょうか。

因みにアーカイブしていたのはChakuwikiの一部ページです。

544192.168.0.7742020/12/17(木) 21:28:26.50ID:67XwC+lO0

前からたまになかったっけ？このスレでも上の方で何度か言われてたような

545192.168.0.7742020/12/17(木) 23:12:31.52ID:A7vSMMBJ0

>>543
そのサイトの運営者（chakuwikiで言えば亡くなった創設者の人）は、自分がそのサイトの運営者だという証拠を提出した上でアーカイブの削除を要請できる
この要請が通れば、Internet Archiveから既存のアーカイブが削除されるようになっている
chakuwikiに関してはおそらくそういう心配はないと思う
可能性があるとしたら遺族が削除申請を出すことかな

546192.168.0.7742020/12/17(木) 23:17:57.23ID:A7vSMMBJ0

あとInternet Archiveのサーバはよく不具合を起こす
これのせいで、ちゃんと取れているはずのアーカイブが一時的に見れなくなったり、
アーカイブはちゃんと取れているのに、まだ取られていないという誤った表示が出てきたりすることがある
多分だけど>>543はその不具合にたまたま遭遇したんだと思う

これはInternet Archiveのサーバ内部の問題なので、こちらが取れる対処法はない
サーバの調子が良くなってまた見れるようになるのを待つしかない

547192.168.0.7742020/12/17(木) 23:20:53.20ID:A7vSMMBJ0

借井戸に「今週月曜日に取ったはずのアーカイブがごっそり消えている」って報告があったけど、
これは>>546で説明したサーバ不具合の典型的症状やね...

548192.168.0.7742020/12/18(金) 20:05:26.93ID:I5zRjHzA0

Chakuwikiのアーカイブについて
https://52.69.139.163/index.php/
のドメインで今アーカイブをとっているのですが、"()"の他に"!"や"&"がURLに入っているページもWayback Machineではうまく保存できないことが判明しました
（archive.todayでは保存できたのですが…）

549192.168.0.7742020/12/19(土) 02:11:50.74ID:Xqo4Hlfy0

>>548
もしかしてAPIでチェックしてる？
APIでは一部記号（自分が確認出来たのは"&"）が入ってるとアーカイブされててもレスポンスが空の不具合がある
カレンダー側では問題なく確認出来るよ

550192.168.0.7742020/12/19(土) 15:18:27.59ID:hlXdl83U0

今日Chakuwikiのアーカイブを見て回ったら多くのページが保存されていました。
少なくとも普通に閲覧に支障がないレベルでアーカイブ化が完了しております。

551192.168.0.7742020/12/22(火) 00:11:10.59ID:ck8IlUdE0

攻略サイトのアーカイブがあったら便利だと思う

552192.168.0.7742020/12/22(火) 13:53:42.96ID:A07YUt/w0

@wikiとか？
～wikiとかwiki系で攻略wiki作ってるの多いよね

553192.168.0.7742020/12/22(火) 14:12:52.20ID:FQJnL9rZ0

atwiki系のサイトがサービス終了したら影響大きいだろうな

554192.168.0.7742020/12/22(火) 15:44:40.36ID:dhdxyEHd0

ランス10みたく色んなwikiに情報あるならまだマシだけど、
攻略サイト作成者や利用者が声がデカイ一部の一強厨にゴリ押しされて、
2番手移行を併合しようとするような流れになったら困る

分かれてるのは作成者とその周辺と気が合わないというのもあるだろうけど、
いつ消えるか分からないこのご時世、何かあった時のための避難所0では無保険過ぎて不安だし

555192.168.0.7742020/12/23(水) 22:26:51.27ID:Ff2Y6ihq0

chakuwiki、とうとうサーバ自体が消えたっぽい

556192.168.0.7742020/12/23(水) 22:40:04.53ID:Y66pe0em0

あらら

557192.168.0.7742020/12/23(水) 23:32:41.83ID:Ff2Y6ihq0

もうちょっと早めに分かってればなぁ
Mediawkiの機能を使った記事や画像のエクスポート自体は完了しているらしいのが不幸中の幸いかな

558192.168.0.7742020/12/24(木) 16:06:55.70ID:JkNaumUN0

chakuwiki.org

559192.168.0.7742020/12/24(木) 16:07:47.57ID:JkNaumUN0

>>558
クローンサイトらしい

560192.168.0.7742020/12/25(金) 00:43:20.22ID:cNkRqGyv0

>>552
HTMLで書かれた個人サイトも忘れずに

561192.168.0.7742020/12/25(金) 22:50:27.91ID:9qhqNqL90

今時個人サイトのゲーム攻略は絶滅危惧種でしょ
だからこそ保存しなきゃいけない訳だが

562192.168.0.7742020/12/26(土) 15:11:07.30ID:8pI8HusK0

>>561
ぶっちゃけエロゲ攻略サイト以外の個人ゲーム攻略サイトなくね？ｗ
どーでもいい、スクショもない感想サイトや呟きレベルならあるけど

563192.168.0.7742020/12/26(土) 17:11:37.89ID:BbmhGsC00

>>562
昔はエロゲ以外のゲームのやつも結構あったんだよ
だからこそ「絶滅危惧種」って言った訳

564192.168.0.7742020/12/27(日) 07:00:17.63ID:1AIVcw2g0

Wayback machine がFlashをアーカイブして2021年以降も使えるようになるって本当？

565192.168.0.7742020/12/27(日) 12:27:01.23ID:OAvLElxI0

>>564
どの程度網羅してるのかはわからないけどここから確認できるね
https://archive.org/details/softwarelibrary_flash
好きなのクリックすればPCからでもスマホからでもflash playerなしで実行できる

データ持ってる場合はアカウント作ってこの記事の下辺りにある手順でアップロードすればいいらしい
http://blog.archive.org/2020/11/19/flash-animations-live-forever-at-the-internet-archive/

566192.168.0.7742020/12/27(日) 12:49:34.69ID:nAtd+FF20

過去にwayback machineで保存されたWebページからデータからぶっこ抜いてinternet archiveにアップロードしてみんなが使えるようにしてる人もいるみたい
https://twitter.com/textfiles/status/1330334049915858944
https://twitter.com/5chan_nel (5ch newer account)

567192.168.0.7742020/12/29(火) 00:49:00.02ID:fGs7aR1x0

Wayback MachineでアーカイブされているサイトのFlashで作られたメニューって2021年以降に見られるのかな？
調べてもよくわからない…

568192.168.0.7742020/12/30(水) 18:17:22.94ID:90IN69Gr0

若干スレチかもしれないけどどこに書けばいいのかわからないので
ニコニコ動画の「テクノ」の記事に貼ってあった
http://techno.org/electronic-music-guide/
このサイト、とても参考になるけど全体がFlashで出来ていて、ローカルに保存したswfでもRuffleを使ってみても（今のところ）きちんと動かなくて
このままじゃ来年見られ無くなっちゃうから元のサイト（www.di.fm）の方にFlash以外での形式で公開してほしいって伝えたいけど自分には英語力がない…
誰か英語のできる人が伝えてほしい

569192.168.0.7742020/12/30(水) 18:22:29.55ID:90IN69Gr0

>>568
568です
ニコニコ動画→ニコニコ大百科の間違いでした

570192.168.0.7742020/12/30(水) 20:33:01.57ID:7rdlBseX0

>>568
よく分からないけどこのサイトってどこかの法人が運営してるものっぽいね
他のページは更新されてるのにこれはFlashのまま放棄されているあたり、運営側としても更新する予定はないんだと思うけど

571192.168.0.7742020/12/30(水) 20:34:00.97ID:7rdlBseX0

あと、依頼するならここよりもテクノ系の5chスレッドを探して書き込んだ方がいいと思うよ

572192.168.0.7742020/12/31(木) 12:32:10.38ID:5dDGXSjX0

>>565
有名なものならあるようですね
もっと増えて欲しいな

573192.168.0.7742020/12/31(木) 15:27:29.78ID:jUqjw1pb0

https://automaton-media.com/articles/newsjp/20200203-112338/
こういったものもあるみたい
仕組みはいまいちよく分からないが

574192.168.0.7742021/01/01(金) 17:14:31.78ID:vTF78S5L0

https://ch.nicovideo.jp/nicotalk/blomaga/ar1955376
【ニコニコ動画】コメントサーバー・システムのリニューアルと、それにともなう一部機能の終了について

前にも出てたが動画跡地の他にコメントの過去ログも完全には見られなくなる模様。
うｐ直後のコメントとか見たい時があるので取得しておきたいけど何か良い方法は無いかな

575192.168.0.7742021/01/01(金) 17:57:54.92ID:61If5RTI0

だいたい再現ってのはコメントの一部を消すってことじゃなくてコンマ以下の秒数とか表示位置が若干変わるってことじゃないかな？
過去のコメントアートが楽しめなくなるってことだから結局よろしくないんだけど

576192.168.0.7742021/01/01(金) 18:04:16.35ID:VRDQC31q0

どんどんつまらないインターネットになってくな

577192.168.0.7742021/01/01(金) 23:46:40.12ID:ORqqm+qO0

削除動画のコメントについてはArchiveTeamに依頼しようとしてた人いたよね
どうなったんだろう

578192.168.0.7742021/01/08(金) 20:40:53.18ID:23QpLw4X0

>>559
アフィで原住民ともめた曰く付きが管理人

579192.168.0.7742021/01/10(日) 11:31:17.49ID:rsgyZDHH0

2ch(5ch)が閉鎖されたら過去ログはどこかアーカイブしてるのかな

580192.168.0.7742021/01/12(火) 00:33:19.63ID:aav8V+4w0

>>579
ある程度は既にアーカイブされてるんじゃないだろうか
まあ閉鎖が発表されたら誰かがアーカイブプロジェクト立ち上げるだろうけど

581192.168.0.7742021/01/12(火) 01:22:47.19ID:uojRCtJs0

完全ではないけどmimizunとかログ速とか

582192.168.0.7742021/01/12(火) 21:45:06.15ID:tYoR8j5L0

そもそも昔から2ch過去ログサイトはいっぱいあるよね
まあ最近見ないから消えたかもしれんけど

583192.168.0.7742021/01/13(水) 03:35:42.25ID:XzQwgawd0

過去ログサイトとウェブアーカイブってちょっと違うような気はする
まあWayback Machineに入ってないスレは沢山あるだろうね

584192.168.0.7742021/01/16(土) 17:03:51.78ID:3A5W7IEK0

ニコ動そのものがサービス終了したら動画のアーカイブはどうなるんだろう
やっぱりArchiveTeamかな

585192.168.0.7742021/01/18(月) 19:39:35.39ID:1x0bZ4YH0

動画データってアーカイブ可能なの！？
じゃあ…Pornhubのデータは…

586192.168.0.7742021/01/18(月) 21:20:43.57ID:IjzqQxcQ0

>>585
一般に動画のアーカイブは技術的に難しい
ストリーミング配信の動画なんかは特に難しい

587192.168.0.7742021/01/18(月) 22:35:35.34ID:+jP6yxXM0

動画ダウンローダあるんだからアーカイブ自体は可能
無劣化は無理っぽいけど

588192.168.0.7742021/01/19(火) 22:37:31.86ID:lxRWFQ6M0

mp4のまま丸々上げてるサイトなら別だけど普通は無理だよ
自分でダウンロードして動画のアーカイブの方にアップロードするしかない

589192.168.0.7742021/01/19(火) 22:51:33.07ID:7KqAH0Yd0

そりゃ情弱には無理
痛いpc雑誌読者以下の情弱っぽいし

590192.168.0.7742021/01/20(水) 07:30:47.61ID:WT4rpqz70

ストリーミング形式はHeritrixも無理らしいという話は聞いたことがある
本当かは知らん

591192.168.0.7742021/01/20(水) 20:17:20.26ID:EkoIINwL0

そういえば既に知っている人もいるかも知れないが、URLのリストから一括でSavePageNowできるアドオンがある
Firefox、Chromeともにウェブストアにはないけど起動時に読み込めば、一括保存(BulkSave)、右クリックで保存とかができる
https://github.com/internetarchive/wayback-machine-webextension
ここのInstalling the Latest Buildのところにインストール方法が載ってる

592192.168.0.7742021/01/20(水) 23:22:59.02ID:dMVBuuQl0

>>591
野良だからな～
コード読める人、こういうの↓の検証頼む

【Firefox,Chrome】危険なアドオン・拡張機能の一覧を作るスレ【Edge,etc】 [無断転載禁止]©2ch.net
http://2chb.net/r/software/1483763294/33

33 名前：名無しさん＠お腹いっぱい。[sage] 投稿日：2018/02/13(火) 11:00:20.51 ID:aB7Xo92Z0
ソース見てXMLHttpRequestかfetchが書いてある場合は注意した方が良い。
XMLHttpRequestかfetchはpostで情報送信できるので。manifestのパーミッションも不要だし。
拡張で情報送信できるのはこの2つの関数だけだと思う。

593GeoLog Project ◆RJRIJK3wcLw8 2021/01/26(火) 22:50:10.34ID:A19kfSBt0

ArchiveTeamがso-netも始めたみたいですね
https://wiki.archiveteam.org/index.php/So-net_U-Page%2B

594192.168.0.7742021/01/28(木) 22:55:09.92ID:qWdIByIL0

WayBackMachineにSo-netが追加されてた
今回は全てを取得することはできなかったみたいだがほとんどを取得できたみたい
感謝ですね

595192.168.0.7742021/01/29(金) 13:46:14.84ID:fKGUCp210

so-netもサービス終了か

596192.168.0.7742021/01/30(土) 05:46:22.13ID:jbLv2ZF+0

外出自粛で引きこもり増えてるんだからウェブサービス全盛かと思うのにな
サービス終了ラッシュで流れ弾のどれかに当たって鬱こもり増えそう

597192.168.0.7742021/01/30(土) 18:06:31.16ID:9LlaKpOV0

IPFSが普及すれば価値のある情報がもうちょっとは残りやすくなるのかな
ピン打つだけでローカルに保存できるの便利

598192.168.0.7742021/01/30(土) 22:13:26.31ID:g+UddPtz0

>>596
家でもスマホって人が多数派だろうからPC向けのサービスには辛い時代

599192.168.0.7742021/02/07(日) 22:03:08.65ID:PATKCzwG0

そういや自分で適当にサイト立ち上げてそこにバックアップしたいURL書き込み、してIAでsave outlinks使えば実質的にそこに書いてあるURL一括でバックアップできるよな？
save outlinksは会員限定機能で特定のページ内に書いてあるURL全部バックアップする機能

600192.168.0.7742021/02/07(日) 22:19:27.61ID:PATKCzwG0

これ思いついて今までURLに置換ツールで/save/つけてクリップボード一括開きしてたのが馬鹿らしくなった
あれサーバーに負担かけるしエラーの確認だので時間とられるし
注意点としては余計なリンク作らないことだな、だからブログとかでやるのはやめたほうがいい
何回も同じリンクをバックアップするから規制される可能性もあるし、真っ白なページ作ってURL記述が最善
読取用にHTMLでURL記述する必要があるが置換ツール使うかブックマークインポート使えば簡単にできるはず

601192.168.0.7742021/02/08(月) 11:45:19.12ID:bbPCsvBH0

何個だったか忘れたが、save outlinksは読み込める外部リンクの数に上限があったはずだからそれは要注意だな

602192.168.0.7742021/02/08(月) 12:45:54.21ID:AksXCukq0

やってみたらできた
URLの一覧をHTMLコードに変換してホームページ作成サイトにアップロードしてからそのリンクをバックアップ
save outlinksでバックアップできるURLは100個が限界で100個超えてたらランダムに選ばれるみたいだから要注意
FC2ホームページ使うと最後にPowered by FC2ホームページっていうリンクが強制で1つ最後に入ってしまうから実質は99個が限界かな
完全に真っ白なページ(広告もなし)作れれば理想なんだがどっかないかな、ちなみにAndroidスマホをWebサーバー化したらバックアップ時にエラーが出た

603192.168.0.7742021/02/08(月) 14:34:59.59ID:bbPCsvBH0

>>602
GitHub PagesかNetlify使ったら？
前者はGitの知識がないと厳しいから実質後者一択かな

604192.168.0.7742021/02/08(月) 20:07:50.66ID:AksXCukq0

>>603
なるほど、やってみたけどやはり手軽なのはFC2だな、indexファイル含めたフォルダごとアップロードしないといけないのは地味に手間だ
FC2はファイルマネージャーにドラッグドロップするだけでアクセスできるようになるからかなり時間効率はいい
複数バックアップのリスクもこれ見る限りでは大丈夫そうではあるな
【保存・記録】ウェブアーカイブ総合 Page.01 ニコニコ動画>1本 ->画像>14枚

605192.168.0.7742021/02/08(月) 20:10:39.63ID:AksXCukq0

ただ複数ファイル最初からアップロードするならNetlify使ってやったほうがやりやすいかもね
100ジャストだから数えやすいし
URLに/ファイル名つけるだけでまとめてアップロードしたhtmlにはアクセス可能

606192.168.0.7742021/02/08(月) 22:35:56.52ID:AksXCukq0

とりあえずまとめてバックアップしてみたけど上限の100個でも問題なくできるね
特定のURLがずっとSavingが続く場合は画面のURLをバックアップ成功したの含めて全部コピーしてメモ帳に貼り付けしてサクラエディタとかで「Done!」が入ってる行を一括削除処理するとバックアップできてないURLだけメモ帳に残せる
そしたらサクラエディタで/web/2/付け足して数日経ったらまとめて開いて保存できてるか確認、一見ずっとsavingになってても後で確認したら保存できてる可能性が高い、バックアップできてなければ再度バックアップ
これで、手間がだいぶ減る
あとFC2ホームページは日本語の入ってるURLは文字化けするね、netlifyは特に何も設定しなくても文字化けはしない

607192.168.0.7742021/02/08(月) 23:09:30.63ID:AksXCukq0

あと、これやるならsave error pagesのチェックは毎回外したほうがいいかも
大量にやるとバックアップされる側が一時重くなるのもあるから404ページが保存されてしまうかもしれない

608192.168.0.7742021/02/09(火) 01:20:04.21ID:WeH/rIuE0

ゲームやりながらほぼ放置でURL1600個バックアップできた、一度に100個保存できるのは革命だな
やはりsave error pagesのチェック外すのは必須、結構高い頻度でgatewayエラー出るから
多くて100個中5個くらい、出るときはだいたい1.2個エラーになる
チェック外しておくとwaybackmahineがどのURLがエラーで保存できなかったか通知してくれるからそれは手動で個別にバックアップ

609192.168.0.7742021/02/09(火) 16:38:32.21ID:zDnBjMvk0

>>608
さすがに大量のリンクをアーカイブするのはSPN側のキャパもあるだろうしArchiveTeamに頼んでSPNじゃないところでアーカイブしたほうがいいと思う。
じゃないとSPNのサービス縮小、最悪の場合はSPN終了になりかねない
ArchiveTeamのIRCでDeepl翻訳とか使って言うと対応してくれるらしいので
https://webirc.hackint.org/#irc://irc.hackint.org/#archiveteam-bs

610192.168.0.7742021/02/10(水) 00:34:19.03ID:z46S15zT0

Save Page Nowあんまり使いすぎてSPN自体が無くなったらどうしようもないから、自分はSPNでアーカイブする量をセーブしてる
多くても週300くらい

611192.168.0.7742021/02/10(水) 18:55:46.65ID:m/SVxvNY0

>>609
Save outlinks自体が大量バックアップしてくれっていうような機能だし大丈夫じゃないか？
ブログとかだったら意図的じゃなくても1ページ50リンク以上あるとかザラだし、大量バックアップ推奨してなかったらあんな機能普通つけないよ
個人的に無会員で大量にタブ開いてバックアップするのが一番負担かけるやり方だと思うわ、それよりはかなり負担少ないように感じる
save outlinksが会員限定機能な以上邪魔になったらアカウント制限しにくるだけ、何個も重複してバックアップとか意図的に負担かけるようなことしなければ平気だとは思うけど、ただしやりすぎは禁物かもね
あと正直archive teamは画像のバックアップを正常にとれないみたいだから画像ありきのページだと正直依頼するには微妙かもしれない、Naverまとめとか画像まともに表示されてないものが多い、手動で保存したものはしっかり表示される
waybackmachineの自動クロールも画像保存されないことある、手動だとやはり保存される
負担減らしたいならバックアップ済はバックアップしないってチェック項目あればいいのにね

612192.168.0.7742021/02/11(木) 10:34:08.22ID:f+DQ9uVI0

別に問題ないと思うよ
よく負荷がどうこうっていうけど、個人サイトじゃあるまいし影響は無い

613192.168.0.7742021/02/12(金) 02:19:02.11ID:D+7XoyFI0

容量の負荷は軽減出来るが処理負荷は増えそう

614192.168.0.7742021/02/15(月) 17:24:11.93ID:BROhNSp40

【告知】ニコニコ動画のコメントサーバーリニューアルに向けた機能提供終了・変更のお知らせ【PC版ニコニコ動画】｜ニコニコインフォ
https://blog.nicovideo.jp/niconews/147588.html

615192.168.0.7742021/02/15(月) 18:01:13.52ID:KmI3cA970

>>614
■ 実施スケジュール

実施日時実施内容
2021年3月1日（月）
過去ログ機能の変更
過去ログのURL共有機能を提供
2021年3月15日（月）
削除された動画へのコメント投稿とコメント表示の終了
　- 動画タイトルや説明文などの情報も表示されなくなります
マイメモリー機能の提供を終了
　- マイメモリーの新規作成や、既存マイメモリーの視聴ができなくなります
2021年春以降
動画コメントサーバーを新コメントサーバーに順次リニューアル
2021年リニューアル
完了後
動画投稿一覧などに表示される最新コメントに、投稿者用NG設定を適用
「コメント投稿ユーザーをNG登録」する機能の効果を永続化
自分が投稿したコメントを削除できるように

616192.168.0.7742021/02/21(日) 10:24:19.04ID:0mwGDu3d0

会員になることのメリットって何かある？

617192.168.0.7742021/02/21(日) 12:57:56.20ID:Ya0mID5E0

outlinksとGoogleSpreadsheetのバッチ処理が使える。

618192.168.0.7742021/02/22(月) 10:04:51.68ID:+ks65Y9m0

超便利

619192.168.0.7742021/02/23(火) 10:23:00.62ID:uox55Xkf0

iRONNA終了
> ２０１４年１０月にスタートした総合オピニオンサイト「iRONNA」は、
> 諸般の事情により２０２１年３月下旬をもって新規コンテンツの公開を終了することになりました。(中略)
> 　尚、終了後もこれまでのiRONNAのコンテンツが閲覧できる環境を維持するための態勢構築を進めています。(後略)
https://ironna.jp/article/16883
閲覧は維持してくれるらしいので緊急性はない。

620192.168.0.7742021/02/23(火) 16:53:36.76ID:qBkXHra00

総記事数1万7000くらいか

621192.168.0.7742021/02/23(火) 17:22:19.47ID:BW828Cy80

せっかくwaybackmachineでアーカイブしたのに、どうアーカイブされているか見ようとしたら別の日にアーカイブされたものに飛ばされてしまった。
少し待たないとダメな感じ？

622192.168.0.7742021/02/23(火) 18:18:35.09ID:uox55Xkf0

基本少し待って確認だけどそれでも反映されてなかったり、反映されてるけど取れてなかったりする。

623192.168.0.7742021/02/24(水) 22:58:36.25ID:3JX98v140

ここ最近は調子悪いからしばらく様子見たほうがいいよ

624192.168.0.7742021/02/27(土) 08:23:57.01ID:6CS9oMdW0

この前読んだ漫画に、WaybackMachineを使っているシーンがあった
1コマ程度だけど

625192.168.0.7742021/02/27(土) 20:23:05.25ID:Ly2ncyWo0

Archive Teamでニコ動のコメントとメタデータ（タイトルとか説明文）の保存が始まった
動画の中でも日本からしか見れないものとかはArchiveTeamの人からは取得できないらしく
Dockerを扱える人いたらWarriorというパッケージを導入すれば誰でも貢献できるのでやってくれるとありがたい
https://hub.docker.com/r/archiveteam/warrior-dockerfile/
https://wiki.archiveteam.org/index.php?title=ArchiveTeam_Warrior

626192.168.0.7742021/02/27(土) 21:59:52.26ID:Jb4WnfRj0

わおナイス

627192.168.0.7742021/03/01(月) 00:57:53.21ID:ihnmbLOX0

最近ニコ動の調子が悪いのはこれのせいなの？
落とすようなのはリスクあるから自分とこのIPではあまりやりたくないな…

628192.168.0.7742021/03/01(月) 01:35:46.84ID:wfxDiFoy0

割と可能性はあるな

【3/1 0時追記】動画が視聴できない不具合など【調査中・ニコニコ動画】
連日の不具合につき、ご利用の皆様にご不便をおかけし、大変申し訳ございません。
本不具合について、海外からの通常の量ではないアクセスにより、引き起こされております。
現在、さらなる原因調査と、追加の対応を行っております。

不具合発生時間
2021年2月28日（日） 06:06頃～

https://blog.nicovideo.jp/niconews/148255.html

629192.168.0.7742021/03/01(月) 02:04:13.92ID:wfxDiFoy0

この公式ページの情報によると2月27日23時頃から断続的に不具合が起こってるらしいね
ニコ動アーカイブのトラッカーはここから確認できるっぽい
残り70万/3500万で今も動いてる
https://tracker.archiveteam.org/niconico/

630192.168.0.7742021/03/01(月) 02:11:24.07ID:0zo7s6Wq0

luaスクリプト読んでみたら、waitもかけずに全力でぶん回すようになってるじゃん
そりゃニコ動も不安定になるわ。DDoSそのものだもん
https://github.com/ArchiveTeam/niconico-grab/blob/ade778c0df8bd3ee5b0aa497c79e9ed97a604883/niconico.lua#L356

631192.168.0.7742021/03/01(月) 06:14:48.33ID:L+5MH82N0

>>630
間隔を1秒たりとも空けてないとは思わなかった
プルリクエストした方がええんかな
ArchiveTeam側に連絡取れるようならあちら側で対処してもらうよう依頼した方が良さそうかな

632192.168.0.7742021/03/01(月) 06:26:19.58ID:L+5MH82N0

今気付いたがアーカイブする対象の動画はどういう指定になってるんだろう
sm+数字連番とかで指定されているようならnmはどうなるんだ

633192.168.0.7742021/03/01(月) 06:34:33.80ID:LwaG001V0

間隔なしでアクセスしてたのか
連絡できる方お願いします

634192.168.0.7742021/03/02(火) 21:56:05.22ID:lV2sHV+Y0

https://entame.nifty.com/

635192.168.0.7742021/03/03(水) 21:00:06.05ID:qMU8PBl90

>>629
保存が止まってるような気がする

636192.168.0.7742021/03/03(水) 22:36:32.38ID:IvY6bDaH0

意図的に止めたか、UserAgentとかでブロックされたか

637192.168.0.7742021/03/04(木) 19:19:41.51ID:0W4MjtMV0

今日archive.isでページを保存しようとしたら
「One more step
Please complete the security check to access archive.is」という画面になった
（そのページのURLは�https://archive.is/submit/”、あと”私はロボットではありません”っていうのも出てくる）
こうなるのはなぜ？