重複文削除プログラム

山田 太郎が3回重複している。
大石 望が2回重複している。
ようにわかりやすくしました。
ただし、CSV形式は1列のみの重複箇所をチェックします。現在のところ複数列には対応していません。

CSVの複数列にも対応しました。2016/5/22

UNDOについて

TXT形式およびCSV形式に書かれているテキストの重複を見つけ、瞬時に重複箇所を削除するプログラムです。

上記のマクロで動かしたものは、元には戻りませんが、Bパネルを手で入力したものを一歩手前にもどします。

デスクトップに「原本.txt」と修正した「重複テキスト.txt」に保存されているので、「重複テキスト.txt」の名前を原本にかえてホルダーに戻すと作業が早くなります。2016/5/17にtxtとcsvを分けたため4つのファイルが保存されます。

※エクセルは、保存をCSV形式にすると動きます。

原本です。

最初に重複a.txtを読んでみます

起動すると下記の画面がでますので、「ファイルの選択」で【テキスト形式】【複数列CSV】かを選び、「重複訂正(Bパネル)上書き保存」を押すだけで、重複を取り除いたものが、立ち上げたファイル(原本)に自動で上書き保存されます

保存の仕方は2種類あり、仮保存は、Bパネルのテキストをデスクトップ上に「仮保存.txt」に保存します。訂正が終わったら、「重複訂正(Bパネル)の上書き保存」を押すと、原本に保存されます。

保存について

Aパネル

右側に重複を取り除いたデータが瞬時に集まりますので、「重複訂正(Bパネル)上書き保存」を押すだけです。

後はオプションで重複しているものを見たりできます。一応テキスト編集をおまけ機能でつけました。

下のように行単位で重複しているかどうかは、テキストで行えば探せますが、この機能を新たにつけ加えました

CSVで行単位の重複を可能にしました。2016/5/22

スペース除去について

文字通り半角や全角のスペースをすべてなくします。前後の空白のみ削除したい場合は、Bパネルの上にある空白削除を押してください。

おまけの機能 Bパネルのテキストを操作します。

・次回起動でも、前回の作業場所(フォルダ)から重複チェックできるようにしました。2016/5/17
・ファイルの履歴を見れるようにしました。2016/5/17
・文字の文頭や文末に任意の文字の挿入ができます。2016/5/17
・1:のように行番号の挿入ができます。2016/5/17
・何が重複しているかテキスト形式で見られるようしました。※CSV形式は1列のみ2016/5/17
・隠しファイルでもチェックできるようにしました。2016/5/17
※隠しファイルは、見られますが重複削除したものが上書き保存できないため改良しました。
・何が重複しているか教えてくれる機能のバージョンアップを2016/5/21に改良しました。
※複数列のCSVにも対応しました。2016/5/22

以上が基本的な使い方です。2016/5/20にテキストで何が何回重複しているか確認できるようになりました。

重複数も確認できます。この場合8番と9番の2か所が重複しています

ファイル選択し、テキスト文かCSV形式のどちらかを選んでください

使い方

Bパネル

・改行の↓があるとき、改行も重複していると判断します。
・重複チックしながら、改行の↓は削除します。
・EOFの位置で重複していると判断してしますため、EOFは最後の文字の右に入れてください。

※ ぼくは、の区読点「、」を[,」にする学校はこれを使うと便利です。上記のスペルチェツクから、「、」は除いています。

使い方は、あらかじめ置換したい場所をマウスで反転させてから、「置換」ボタンを押します

何で区切るかを聞いてきますので、Bパネルのテキストを何でも区切ります。あると便利な機能です

区切りについて

1列以上のCSV形式の重複もチェックできるようにしました。さらにバージョンアップしました。2016/5/14

重複している3行目と6行目を抜かしたものが、Bパネルにでます

重複訂正の上書き保存は、Bパネルのテキストを開いたファイルに上書き保存するようプログラムしています。そのためBパネルをどのように変えてもその書式通りに開いたファイルに上書きしますので、とても便利な機能です。

置換について

下は、「。」で区切ったもの。

CSV選択を押すと、何列目の調査か聞いてきますので、ここでは1列目の調査をするため「1」と入力します。

1列目でBBBとDDDが重複しているとき、重複している行を削除できるようにしました。もちろん何列目の重複チェックができます。

重複訂正の上書き保存について

CSV形式の2列以上の重複を見つけるのは無理だと思われましたが、できました。重複箇所を目で見られ、ボタンひとつで立ち上げたファイルに重複しないものを上書き保存するようにしました。かなり重宝するソフトだと思います。作られた発想はつれづれ草Vシリーズと方丈記Vシリーズの所見が増えると日にちによってそれが重複しているのかどうか見つけるのにかなりの労力が必要という理由で作られました。また区読点の重複チェックと文の分解(区切り)も必要なのでつけました。Bパネルで編集したものは立ち上げた原本に上書き保存できます。

追加機能

終わりに

その他注意すること

検索について

検索も検索したい文字をマウスで反転させ、検索開始を押します。そうすると下のように、検索したい場所に「★」を一気につけます。「検索解除」で★をすべてなくします

スペルチェック一覧表PDFで確認します

文章の区読点の「。。」が連続したりするのをチェックして直してくれます。

スペルチェツクについて

メモ帳だと、前後の空白は、気づかないです。下のように文章前後の半角と全角のスペースを一瞬で取り除きます。

その他

空行があり、一つずつ直すのは面倒

空行がなくなった

行と行に空白がある場合削除します

空行削除について

文章前後の半角と全角のスペースを瞬時に除去します

空白削除について

空白がなくなった

前後に空白があるが一つずつ直すのは面倒

inserted by FC2 system