Skip to main content

Toshiro Shimura's Library tagged encode   View Popular

25 Jul 08

Firefox 3 の新機能 - えむもじら

  • # ★ ロケーションバーの改善(Bug 366797)、MozillaWiki、 えむもじら)

    * ★ URL の%エンコードをデコードして表示。コピー時は元に戻す(Bug 105909)
    * eTLD のハイライト(Bug 386727)
    * ★ 認証情報を表示(Bug 383183、スクリーンショット)
    * ★ URL の履歴と検索結果候補にファビコンを表示(Bug 373353、えむもじら)
    * ★ 自動補完機能の改善(Bug 389491)
    * ファビコンを取り除く(Bug 382220)

    - toshiro on 2008-07-25

URL エンコード/デコードフォーム

  • URL エンコードって何?


    わかりやすくて身近なのは検索エンジンの「検索」ボタンを押した後の Web ブラウザのアドレス欄でしょうか。入力した文字列がそのアドレス欄の URI に含まれているはずです。しかし、その URI に含むことができない文字が存在します。それらを使用できる文字を使って変換することが URL エンコードなのです。

Firefox 3 のロケーションバー - えむもじら

今日もガクリ('A`) » Firefox 3 : ロケーションバーにマルチバイト文字を入力

  • Firefox 3 のロケーションバーにマルチバイト文字を入力して、サイトにアクセスすると正しく URL が渡らない。検索エンジンなどで使用すると、一部の検索エンジンで入力した文字列が正しくサイト側に伝わらず文字化けしてしまうという問題が…('A`)

    ロケーションバーを見ると、何やら URL がエンコードされている様です…この件で検索してみると、やっぱり同じような問題が見つかりました。about:config の network.standard-url.encode-query-utf8 の値を true に変更する事で問題が解決しました

    user_pref("network.standard-url.encode-query-utf8", true);

    ところが、この問題は半分解決したといった方がいいでしょう。何故なら、この設定はサイト側の URL エンコード処理が UTF-8 の場合しか効果がありません。例えば 緑のgoo に以下の様に文字列を渡してやると、やはり文字化けします 1

    http://green.search.goo.ne.jp/search?MT=漢字入力ですよ

    入力エンコード指定の URL パラメーターにて、以下の様にエンコードを指定してやれば 緑のgoo に関しては、解決です

    http://green.search.goo.ne.jp/search?MT=漢字入力ですよ&IE=UTF-8
    - toshiro on 2008-07-25

OpenCage: Firefox urlエンコード機能をUTF-8化する方法。

  • Firefox1.1では,UTF-8がデフォルトになるということですが,上記の点を考えると,ブラウザーの機能としては,相対リンクに対してはソースの文字コードで,外部リンクにはUTF-8でurlエンコードするのが好ましいような気がしますが,どうでしょう?

     しかし,こういう事柄を「それを意識していない人達に説明する」のは難しいですね。(url-encode,RFC,uri って何??からの説明をしたら嫌がるよなぁ。)

     で,現時点でFirefoxのURLencodeをUTF-8化してしまう方法というのも教えていただきました。

    てんぷる の投稿 :2005/06/06(Mon) 10:18:21
    (環境: WinXP SP2/Firefox1.0.4)
    >  FirefoxのurlエンコードをUTF-8に固定する方法というのはあるのでしょうか,

    Windows の Firefox 1.0.4 の場合、about:config にて
    network.standard-url.encode-utf8 を true に変更すると
    常にUTF-8でエンコードされるようです。

OpenCage: url に日本語が含まれている場合の Firefox と IE の挙動の違い。

  • テクノラティは http://www.technorati.com/tag/**** というuriで,**** という tag を持つ blog の一覧にアクセスすることができるのですが,**** の部分が日本語だと正常に tag の文字情報が認識されません。
    e.g. http://www.technorati.com/tag/日本丸http://www.technorati.com/tag/%93%FA%96%7B%8A%DB

     %93%FA%96%7B%8A%DB はshift-jisの文字列に対するurlエンコード結果なのですが,テクノラティで直接検索窓を利用した結果は,「%E6%97%A5%E6%9C%AC%E4%B8%B8」という文字列になります。

     これは多分 UTF-8の「日本丸」のurlエンコードだと思うのですが,この変換を行ういい方法が見つかりません。basp21を使って文字列の文字コードを UTF-8に変換した状態で,Server.URLencode関数 で変換したものではコードが異なってしまいます。難しい。

     ふと,インターネットエクスプローラーだとどうなるんだろうという疑問が頭をよぎり,http://www.technorati.com/tag/日本丸 という uri からリンクを辿ってみると,何の問題もなく「tag:日本丸」として解釈されていました。

     インターネットエクスプローラーは,見えない部分で,いろいろ補助的なことを行ってくれるのでその一環なのかもわかりませんが,Firefoxとは異なる,なにか特別なことをやっているのでしょうか。

     というのも,urlエンコードは,同じ文字でも文字コードによって変換されるコードが異なりますので,相手先の文字コードを確認してからエンコードをかけないと正しい変換ができない筈です。ということは,IEは相手にデータを送る前に文字コードの変換を行っているのか,逆にFirefoxは相手の文字コードも分からないのにurlエンコードを行っているのか(現状ではそのようです),という疑問が出てきます。
    - toshiro on 2008-07-25
18 Jun 08

[PC] アマゾンやウィキペディアのURLはなぜあんなに長いの? | LxR | R25.jp

  • 「アマゾンの商品紹介ページのURLアドレスが長いのは、日本語の商品名を含んでいるため。書名や著者名など日本語のデータをURLに使う場合、英数記号に分解する必要があるんです。これにより、URLはすごく冗長になってしまうんですね。このように、日本語を記号化することを『URLエンコード』といいます。ウィキペディアやグーグルマップなどのURLが長いのも同じ仕組みです」
28 Nov 07

便利なソフト:Mozilla Firefox|「翻訳会社、やってます!」奮闘記 Part2

  • Firefox の拡張機能である「Locationbar2」は、なかなか良いですよ

    こんな機能を持っています。

    URL を表示するアドレスバーで、2バイト文字情報を含む URL エンコードをデコードして表示する

    例えば、デスクトップにおいたファイルを Firefox でブラウズすると、アドレスバーはこのような表示になってしまいます。

    Locationbar2
    これでは何がなんだかわかりません

    そこで、拡張機能 Locationbar2 をインストールすると、アドレスバーにデコードして表示されます。

    Locationbar2-02
    Google や Wikipedia などをブラウズしたときも、デコードして表示されるので分かりやすくなりますよ


    shift キーを押しながらアドレスバーにマウスを持っていくと、「/」(スラッシュ)で区切られたディレクトリ名をクリックすることでディレクトリの移動ができる

    Locationbar2-03
    階層が深い Web サイトのときはかなり重宝してます

FireFoxのロケーションバー - 思いて学ばざれば

  • PHPのurldecode関数にそれぞれの文字列を渡すと、前者はShift_JISで「諸葛亮」、後者はUTF-8で「諸葛靚」が得られる。こちらもやはり、どちらか一方でのデコードを試み、それに失敗してから他方のデコードを試みているのだろう*3。Shift_JISとUTF-8でかぶっているコードがどうなるかは試してないので分からない。コードのかぶってる文字があるのかどうかも知らないし。


    このurldecode関数だと、返り値のコードがShift_JISなのかUTF-8なのか分からないので、ちと困る。mb_parse_str関数を使うと、どのコードで渡してもかならずUTF-8で返ってくるので*4、いい感じ。これも内部で自動的に判断し、変換してるんだろう。

  • なんでこういうことを書いたかっていうと、【Wikipedia】みたいにURLの一部として渡されたクエリ文字列をキーにデータベースからデータ引っぱってくるような仕組みを作りたかったんだけど、実際テストしてみたらIEやOperaでは問題なかったのにFireFoxで試したときだけ検索に失敗したので、おかしいなと思って調べたら、FireFoxのときだけ文字列がShift_JISで渡されたのに気付いたというわけなんですね。あたしゃてっきりどのブラウザでもUTF-8でしか渡されないと思いこんでたよ。


    それじゃWikipediaではどういう扱いをしてるんだろうと思ってMediaWikiのソースをダウンロードしてみても、どうも文字コードを変換してるらしいところは見られない。おっかしーなーと首をひねった後で気がついた。


    FireFoxではWikipedia使えねぇじゃん。


    FireFoxのロケーションバーに入力された文字列はShift_JISでエンコードされるから、UTF-8の文字列をキーにしてるWikipediaでは当該記事を見つけられず、記事がないよと言われてしまう。オプションを開いても標準エンコードUTF-8に変える選択肢のないFireFoxもダメぽだし、UTF-8前提でShift_JISを受けつけないWikipediaもダメぽだし、ダメとダメがぶつかってダメダメになっちゃった。


    などとちょっと腹立ちまぎれに検索してみたら、「ツール→オプション→コンテンツ→フォントと配色→詳細設定→規定の文字エンコーディング」に設定があるらしい。深えよ!しかもフォントの問題じゃねえよ!しかしようやく「諸葛靚」が検索できるようになった…と思ったら「諸葛亮」だとエンコードに失敗して検索できねえよ!なんでかと思って調べてみたら、「諸葛靚」だとUTF-8で渡されて、「諸葛亮」だとShift_JISで渡されてる。またしてもお前か…!つねにUTF-8で送信してくれよ!*6


    FireFox+Wikipediaでぐぐっても、関連の話題はあんまり出てないみたいだし*7FireFoxのバージョンの問題かもしれないね。少なくとも2.0.0.4では上記のとおりでした。

  • 1 more annotations...

ふと今日は・・・・・・  Locationbar² 日本語文字コード対応化(日本語化済み)

  • Locationbar² を日本語化した。
    この拡張は、ロケーションバーのドメイン名を強調表示したりエンコードされている URL をデコードして表示してくれるものだ。

    日本語化のついでに日本語の各文字コードに対応したlocationbar2 - Firefox更新情報Wikiブログを参考にして日本語のエンコードに対応させた。
    これによって Unicode 以外のエンコードでも文字化けしない。

日本語の各文字コードに対応したlocationbar2 - Firefox更新情報Wikiブログ

    • Custom ButtonsはuserChrome.jsと同じくFirefoxにJavaScriptなユーザースクリプトを追加できる拡張機能なので、自分でいじれば何とかなるかなと思いEUC-JPやShift_JISなどの文字コードでも文字化けせずに日本語URLが表示できるlocationbar2ボタンを用意してみました。…といっても、前述のlocationbar2にデコード関数ライブラリのEscape Codec Library: ecl.jsを組み合わせて1行いじっただけだったり。あまり試していないため不具合はあるかもしれません。

      本来は1クリックでボタンをインストールできるのですがうまくいかないため、Custom Buttonsを含めたインストール方法を以下に紹介します。

      1. ふと今日は・・・・・・ Custom Buttons 日本語化から開発版のCustom Buttons 0.0.2alpha 日本語版をインストールしてFirefoxを再起動。
      2. こちらのスクリプトファイル「locationbar2_jp.js」を新しいタブで開くかダウンロードします。ダウンロードした場合はテキストエディタなどで開いておきます。
      3. 次のリンク「locationbar2(日本語の各文字コード対応版)」をクリックしてボタンをインストール。
      4. 「ツールバーのカスタマイズ」を開き、(3.)で追加したボタンをツールバーにドラッグ&ドロップで配置します。
      5. (4.)で配置したボタンを右クリックして「ボタンの編集...」を選択し、「初期設定コード」欄に(2.)のスクリプトをすべて張り付けてください。「コード」欄は空白で構いません。
      6. ふと今日は・・・・・・ Custom Buttons の自作ボタン配布に記載されているとおり、about:configから文字列「browser.urlbar.hideProtocols」を作成します。ロケーションバーから「http://」や「https://」などを隠したい場合は「http https」のように記入します。
      7. Firefoxを再起動すると使用できるようになります。

ロケーションバーの提案 - えむもじら

  • 以前紹介したロケーションバーの URL を分りやすく表示する Locationbar²Bug 366797作者のサイト)は、かなり頻繁に修正が行われていて、その動向には注目しています。最近、Hacking for Christ: Location Bar Proposal という記事でいくつかの提案が行われ、後でじっくり読もうと思っていたらさっそく Taken SPC で翻訳が公開されていました(Good Job!)。



    ホスト名のハイライトにボタンを使うのはあまり美しくないですね。ようはドメインとパスがきちんと区別がつけばよいので、区切りの印を入れるのだけでも良いと思います。最新の Locationbar²
    0.7.3.1 がまさにそれです。



    l と i の区別のしやすさや、漢字などの IDN 表示時の識別容易性については、なんらかのズーム機能があると良いかもしれません。コンテンツはフォントサイズを自由に変更できますが、同じような仕組みがロケーションバーに合っても良いと思います(マウスオーバー時に大きなフォントでポップアップとか)。

hxxk.jp - 2006/08/14

  • 簡単に説明すると、例えば hxxk.jp 内のタグ "ビール" が設定された記事のように、
    URI
    にマルチバイト文字列を含むリソースへのリンクを指し示したい場合、 hxxk.jp 内では <a
    href="http://hxxk.jp/tag/ビール">hoge</a>
    と記述してもリンク元もリンク先も UTF-8
    であるので Firefox では無事に該当リソースに到達できますが、同じようなリンクを Shift_JIS のリソースに記述すると
    http://hxxk.jp/tag/%83r%81%5B%83%8B という URI
    としてエンコードされてしまい、該当リソースに到達することができません。 なお、文字コードが同じであれば該当リソースに到達することができますが、そもそも仕様上非 ASCII 文字列を URI に直接記述することはしてはいけません。


    そこで、私が hxxk.jp 内でタグページへのリンクを記述する場合は <a
    href="http://hxxk.jp/tag/%E3%83%93%E3%83%BC%E3%83%AB">hoge</a>

    のようにあらかじめ UTF-8 でエンコードした状態で記述しています。 このようなリンクであれば仕様の面でも問題ありませんし、 Shift_JIS のリソースや
    EUC-JP のリソースに記述しても問題なく該当リソースに到達することができます。 ( よって、他の方がタグ "ビール"
    が設定された記事
    を参照したい場合も、 UTF-8 エンコード済の URI をコピーすることで問題なくリンクすることができます。 )


    さて、ここで Firefox のアドレスバーに、 URI
    を直接入力してリソースを取得することを考えてみましょう。 現バージョンである Firefox 1.5.0.6 では、デフォルトでは
    network.standard-url.encode-utf8 の値は false になっていますので、アドレスバーにマルチバイト文字列を含む URI を入力すると Shift_JIS でエンコードされます。 すなわち、
    http://hxxk.jp/tag/ビール とアドレスバーに入力しても
    http://hxxk.jp/tag/%83r%81%5B%83%8B という URI をリクエストした形になってしまいます。 そこで OpenCage:
    Firefox urlエンコード機能をUTF-8化する方法。
    を参考に network.standard-url.encode-utf8 の値を
    true にすると、 http://hxxk.jp/tag/ビール とアドレスバーに入力すると
    http://hxxk.jp/tag/%E3%83%93%E3%83%BC%E3%83%AB という URI
    をリクエストした形になり、無事に該当リソースに到達することができます。

UTF-8によるアドレスバーのエンコード絡み - Kuruman Log - by Kuruma

  • usopionさんがUTF-8でURLエンコードされたURLを取得するブックマークレットを作成された。普段すべてのアドレスをUTF-8でエンコードするのチェックボックスを外して使っていたが、そうしているとUTF-8で記述されていないウェブページ上に全角文字を含むリンクが在った場合に問題が発生するようだ。ブログなどに投稿するためにエンコードされていない状態のURLを取得する機会と全角文字の含まれるURLへのリンクを踏む機会。どちらが多いと問われれば、私の場合間違いなく後者だ。


    ……ということで、x alt, u, r, lGo to page, "javascript:prompt('現在の URI',encodeURI(location.href).replace(new RegExp('%2525([\\da-f])','gi'),'%25$1'));void(0);"を割り当ててみた。これで必要な時にはエンコード前のURLを取得できる。若干opera_exが不便になるが致し方あるまい。どうにかならないかといくらか試行錯誤してみたが、僕の手ではどうにもならなかった。

わかばマークのMacの備忘録 : URL_Encode

  • ブログの中で時々、Wikipedia へのリンクを貼るのですが、Safari で開くとアドレスバーに表示されるURLはメインページの場合、下のようになります。

    http://ja.wikipedia.org/wiki/メインページ

    このまま、aタグでリンクすると、文字化けしたページに移動してしまいます。

    だから、URLに日本語が含まれる場合は、Firefoxでそのページを開いて、URLをコピーしていました(Firefoxだと、日本語をURLエンコードした状態でアドレスバーに表示される)。

    ただ、これでは使い勝手が悪い・・・。

    「URL_Encode」はこんなときに役立ちます。

MacOSXでsafariを使っています。 wikiを見ると、URLがアドレスバーに表示されるの... - Yahoo!知恵袋

  • MacOSXでsafariを使っています

    wikiを見ると、URLがアドレスバーに表示されるのですが一部日本語が混ざってしまって

    コピペしてもそこからリンクになりません。





    例えば http://ja.wikipedia.org/wiki/ヤフー こんな感じになってしまいます。

    本当なら http://ja.wikipedia.org/wiki/%E3%83%A4%E3%83%95%E3%83%BC こうなるべきなんですが…

    どうやったらすべて英字になるのでしょう。

    教えてください。よろしくお願いします。

blogSetomits : JavaScript で URL をエンコード

  • Safari ではアドレスバーに表示される URL がエンコードされていないため、これをコピペしてリンクを作ると IE で適切にリンク先に飛べないことがあったのです。これまではその都度いちいち Firefox を起動して当該ページを開いてその URL をコピペしていたのですが、

    javascript:alert('<a href="http://matatabi.homeip.net/'+encodeURI(location.href)+'" target="_blank">'+document.title+'</a>');


    というブックマークレットを使えば、コピペするためのタグが表示されます。そして、他の多くのブラウザではダイアログの文字列はコピペできないのですが、 Safari の場合はそれが可能なのです。これでhttp://ja.wikipedia.org/wiki/%E9%AD%81!!%E7%94%B7%E5%A1%BEというURLも簡単に作れるようになりました。
05 Jun 07

Nippon plugin « iDeasilo: wp_mail() で正しく日本語メールをエンコード処理できるようにするプラグイン

  • コメントやトラックバックを送られた時に WordPress から通知メールが飛ぶようになっていますが、メールの件名や送信元などのヘッダに日本語の文字が含まれている時など、メールが文字化けするケースが多々あり、日本の WordPress ユーザの共通の悩みだったと思います。このプラグインを入れておくとそれらの悩みが解消されます。


    問題の原因は WordPress がメールを送信するときに使う wp_mail() が日本語のヘッダを Base64 エンコードしていないところにあるようです。このプラグインは wp_mail() を独自に再定義して、正しく日本語メールを送られるようにエンコード処理を加えます。


    効用のわりに名前が大げさですか? Nippon プラグインは日本語環境特有の問題をプラグイン一発で解消したいという願望から名付けられました。今後メールの文字化け以外でもプラグインで解決できる問題があれば機能を追加していくつもりです。


    Update: お知らせ: WordPress 2.2 以降ではこのプラグインを使わないでください。2.2 以降では Nippon 2 プラグインをお試しください。

23 May 07

Elgato Turbo.264: Say Goodbye to iSquint | MacApper

  • The thumbdrive style device plugs right into your Mac, and quickly installs it’s codecs into QuickTime (which includes any app that uses QuickTime’s encoding). It includes four codecs, iPod (best), iPod (small), PSP, and AppleTV. OK, fine, it doesn’t encode at any user defined specification, but it does convert into the four most common, used, and wanted formats. If you’re not into using QuickTime to convert, Elgato includes their own app for converting videos.


    The app can batch convert, gives a video preview of what it’s encoding at the moment, and shows estimated time left and frames per second. Speaking of FPS, the Turbo converted a DivX video of mine to iPod at 48 fps. Not bad at all compared to the 15-25 fps that QuickTime encodes at for me.


    Turbo.264


19 Apr 07

【IDF 2007】Penrynベンチマークセッションレポート

  • 一般にマルチスレッドに対応したエンコードソフトは、アーキテクチャやクロックが同じであればコア数が多いほうが有利だし、クロック差以上にコア数のほうが速度にもたらす影響は大きい。先に示したMainConceptのH.264 Encoderなどは、その典型的な例といっていい。



     しかし、今回のSSE4を利用したDivXでは、デュアルコアPenrynが、Core 2 Extreme QX6800を上回る速度でエンコードを終える結果を見せた。用意されていたサンプル動画が短いものであっため、数秒の差になっているが、一般的な長さの動画であれば、数分、数十分の違いとなるほどの大きな差をつけている。



     なぜSSE4を利用すると動画エンコードが高速になるかについても説明があった。その大きな理由として挙げられたのが、SSE4で追加された「MPSADBW」「PHMINPOSUW」の2つの命令だ。前者は複雑なSAD演算を行なうもの、後者はレジスタ内の値から最も小さなUWORDを抜き出すもの。こうした命令が用意されたことで、MPEGエンコードにおいて時間がかかるこれらの処理を少ない命令数で実行できるとしている。

1 - 20 of 21 Next ›
Showing 20 items per page

Diigo is about better ways to research, share and collaborate on information. Learn more »

Join Diigo