<!DOCTYPE html>
<html>
<head>
<meta http-equiv="Content-Type" content="text/xhtml; charset=utf-8">
</head>
<body><div style="font-family: sans-serif;"><div class="markdown" style="white-space: normal;">
<p dir="auto" style="margin: 1.12em 0;">On 2023-03-27 (KW 13) at 16:07:45 (-0500) Eric Gallager via macports-users wrote:</p>
<blockquote style="margin: 0 0 5px; padding-left: 5px; border-left: 2px solid #3983C4; color: #3983C4;">
<p dir="auto" style="margin: 1.12em 0;">So, the Internet Archive has recently added an "Email me a WACZ file<br>
with the results" option to their "Save Page Now" service in the<br>
Wayback Machine, so I tried that out and got some WACZ files, although<br>
now I don't know what to do with them. Is anyone aware of any software<br>
for handling WACZ files that's available in MacPorts? Or, if there<br>
isn't any yet, could some be added?<br>
More info on the format can be found here:<br>
<a href="https://replayweb.page/docs/wacz-format">https://replayweb.page/docs/wacz-format</a><br>
There are some python tools for interacting with the format, but I<br>
couldn't get pypi2port to generate a Portfile for me for them, and<br>
plus there are kind of too many python things in MacPorts anyways:<br>
<a href="https://github.com/webrecorder/py-wacz">https://github.com/webrecorder/py-wacz</a><br>
Anything else?<br>
Thanks,<br>
Eric Gallager</p>
</blockquote>
<p dir="auto" style="margin: 1.12em 0;">I’m a librarian who does a fair bit with web archives. the short version is this:</p>
<p dir="auto" style="margin: 1.12em 0;">replayweb.page will work to ‘play’ a web archive (warc/wacz). there is a desktop application (electron) that you can grab from github. I find it better than trying to load something like that into firefox. I don’t know what the policy is about adding an electron app into macports is but speaking as a maintainer for an electron app on a linux distro...I’d personally avoid it.</p>
<p dir="auto" style="margin: 1.12em 0;">py-wacz is great for converting warc files into wacz. the primary difference is that the later are compressed. That’s the primary function it has.</p>
<p dir="auto" style="margin: 1.12em 0;">One thing for creating warc files in Macports is wget which works with something like: wget -pkrm --warc-cdx --warc-file=foo -e robots=off <a href="https://foo.org">https://foo.org</a>. I did a write up about it back in 2020.</p>
<p dir="auto" style="margin: 1.12em 0;">I hope that helps a little bit.</p>
<p dir="auto" style="margin: 1.12em 0;">ander</p>

</div>
</div>
</body>

</html>