読む・考える・書く

マスコミやネットにあふれる偏向情報に流されないためのオルタナティブな情報を届けます。

ニュースサイトの記事をPDFできれいに保存する方法

 

Web上のニュース記事は短期間で消えてしまうものが多いので、やはりPDF化して保存しておきたい。

ここで、問題が二つある。

 

一つ目は、どうやってWebページをPDF化するか。

パソコンでやるなら、PDF作成・変換ソフトを使うのがいいだろう。仮想プリンタとして動作するので、紙に印刷するときと同じようにブラウザから「印刷」し、出力先のプリンタとしてそのソフトを指定すれば、PDFファイルが作成される。

無料のものがいろいろあるが、私のおすすめはDoro PDF Writer。インストールや使い方については、こちらの解説がわかりやすい。

スマホやタブレットを使っている場合や、変換ソフトをインストールしたくない場合、オンラインのPDF変換サービスを使う方法もある。これだと、変換されたPDFファイルを直接ダウンロードできる。こちらも無料で使えるものがいろいろあるので、速度や使い勝手など、試してみて気に入ったものを使えばよい。

 

二つ目の問題は、どうやって記事本文だけをきれいにPDF化するか。

一部の新聞や雑誌社のサイトでは記事のページに「印刷」ボタンがついているので、これを押して目当ての記事だけを印刷したりPDF化したりできる。問題なのはサイト側がそうした機能を提供していない場合だ。

たとえばYAHOO!ニュースの場合、記事をそのままPDF化すると、下のようにいろいろ余計な情報がついてきてしまう。これが、あとで情報を検索する際にノイズを増やす原因となる。

パソコン内に蓄積したデータを全文検索して「慰安婦」関係の資料を探そうとしたとき、右下に見えている文字列のせいで無関係なこの記事までヒットしてしまうのは避けたい。

 

こういうとき、オンラインPDF変換サービスWeb2PDFが提供する「Readable」が役に立つ。まず、こちらのページで表示のスタイル、文字サイズ、左右のマージン幅を選んでから、「Make Readable」ボタンをブラウザのブックマークツールバーにドラッグする。

記事を表示している状態でこの「Make Readable」ボタンをクリックすると、記事本文だけが抜き出して表示されるので、あとはこれを仮想プリンタでPDF化すればよい。上のYAHOO!ニュース記事の場合、結果は次のようになる。

これで、記事以外の余計な情報をカットした、すっきりとしたPDFファイルが作成できる。

 

BUFFALO テラステーション ネットワーク対応HDD(NAS) 2TB TS-WX2.0TL/R1

BUFFALO テラステーション ネットワーク対応HDD(NAS) 2TB TS-WX2.0TL/R1

 
I-O DATA USB 3.0/2.0接続【家電対応】外付ハードディスク 3.0TB HDC-LA3.0

I-O DATA USB 3.0/2.0接続【家電対応】外付ハードディスク 3.0TB HDC-LA3.0