Skip to main contentdfsdf

    • coolwebさんからソースコードの公開依頼をいただきましたので、
       載せてみたいと思います。

       

       
       まず、XML-RPCのライブラリを使っています。

       

      The Incutio XML-RPC Library for PHP

       

      ここにあるIXR_Library.inc.phpをそのまま利用していることを
       前提としたソースになります。


    •  

      わざわざブログの投稿記事を作成する画面にアクセスしなくても、いつでもすぐにブログへの投稿が可能になるという Firefox の拡張機能。
       Blogger, Windows Live Spaces, LiveJournal, もちろん WordPressMovable Type など、ブログ投稿用のAPIに対応しているサービスであれば利用可能なので、様々なプラットフォームに対応できそう。
       以前は、Performancing と呼ばれていたみたいですね。

       

      ScribeFire: Fire up your blogging

       

      インストールすると画面右下のステータスバーにアイコンが表示されるようになり、アイコンをクリックすると画面下半分にブログに投稿する内容を記載するフォームが表示されます。
       リッチテキストエディタ(WYSIWYG)とプレーンテキストモードの切り替えも可能で使いやすそう。:oops:

    • どうすれば文字化けが起こらないようになるのか。
       それは
       
       
      自動変換を利用しない

       
       ことだ。
       
       変換の基準となる文字コードを一つ設ける。
       文字コードの変換はすべてプログラム上で行い、
       自動変換させるのは極力無くす。
       これが最も効果的な方法。
       
       自動変換とはhttp_input、http_outputの様なフィルター系や、
       default_charsetの様な付加系(?)のようなもの。
       これらを利用しないことが重要なのである。
       
       もちろんこれは非常に煩わしい作業だ。
       GETやPOSTのデータも一つ一つ変換しなければならないことになる。
       (always_populate_raw_post_data = Onで、
       $HTTP_RAW_POST_DATAを変換するという手もあるが)
       全部手動が煩わしいというのならば、
       自動変換される過程を理解した上で利用する必要がある。
       だが、私も含めてほどんどのPHPプログラマにはかなり難しい内容だと思う。
    • ●default_charsetはデフォルトの文字コードのことではない。
       非常に誤解しやすい内容。
       default_charsetというパラメータはご存じの人も多いと思う。
       それに大抵の初心者本にはこれを設定するように書いてあるが、
       むしろ逆である。
       default_charsetとは
       
       
      出力時にHTTPヘッダとして送信する文字コード名

       
       のこと。

    7 more annotations...

    • 問題の性質を理解するには、Unicodeという文字集合の作成方法を知る必要がある。Unicodeは、全世界の文字コード系を集めて、それに収録された文字をすべてリストアップして整理して作られた。この方法なら、Unicodeの元になったすべての文字コード系にあったすべての文字は、Unicodeに収録されていることが保証される。ところが、である。確かに、足りない文字はないのだが、よく似た文字が複数収録されていて、区別を付けにくい、という状況が起こってしまったのだ。たとえば、横棒の記号の一種であるダッシュ(-)だけでも、何種類も微妙に異なるバリエーションが収録されているのである。さらに困ったことに、どの文字が元の規格のどの文字に対応するか、明確な情報が残っていないのである。漢字に関しては幸いなことに、いろいろ騒動があったため、Unicodeの規格書に元規格との関係が記されているのだが、それ以外の文字に関しては、そのような情報が存在していないのである。

       

       この結果として、主に記号類に関して、元規格とUnicodeの間で、どの文字とどの文字が対応するのか、人によって解釈が違うという現象が起きてしまった。そして、その解釈の違いが解消されないまま、それぞれのメーカーはUnicodeを自社ソフトに組み込む作業に着手した。従来からある資産を活用するために、従来型の文字コード系とUnicodeの間で文字コード変換を必要とするので、当然、変換ルールを記述した変換テーブルというものが作成される。ところが、変換ルールが人によって解釈が違うため、できあがった変換テーブルはメーカーごとに中身に相違があるという事態が生じてしまったのである(具体的な相違点を知りたい方は、筆者の調査結果が公開されているので参照願いたい)。

    • 変換テーブルが何種類もあるということは、XMLアプリケーションソフトが使用する変換テーブルも一定していないということだ。つまり、シフトJISのような従来型の文字コード系でXML文書を書いた場合、使用するXMLアプリケーションソフトの種類によって、処理結果が異なる可能性があると言うことだ。

       

       例えば、XMLパーサのような同じ機能を持ったソフトウェアが複数ある場合、本来なら同じXML文書を入力すれば、同じ出力が出てくることが期待される。ところが、上記のような状況があるため、同じXML文書を入力しても、結果として出てくる文字列の文字コードが食い違っている、という可能性がある。

       

       

       このような状況は、検索機能などでは致命的な問題を引き起こす。また、電子署名など、厳密な一致が得られなければならない分野では、使い物にならないことになる。

    • 日本語を使ったファイル名をLinuxで作成し,別のユーザー(たとえばroot)でそれを見たとき,ファイル名がきちんと表示されないことがあります。これはなぜでしょうか。

       

       さまざまな原因が考えられますが,その一つが前述のlocale設定です。ファイル作成時と読み出し時のlocale設定が食い違っていると,ファイル名を正常に表示できません。

       

       同様の問題は,Windowsなど他のOSとのファイル共有の際にも表面化します。例えば,ディスクのFATファイル・システム領域をLinuxでマウントし,lsコマンドを実行すると写真1のように日本語ファイル名が文字化けすることがあります*1。これも,locale設定の食い違いが原因です。日本語版Linuxでは「日本語EUC」または「UTF-8*2」を標準の文字コードとしているのに対し,日本語版Windowsでは「シフトJIS」を標準localeとして利用しているからです。

    • UTF(Unicode Text Format)はUnicodeのテキストをデータとして入出力する時 に用いるフォーマットです。 
       UnicodeコンソーシアムではUTF-7, UTF-8, UTF-16の3種類のUTFを定義してい ますが、Javaではこの中のUTF-8を採用しています。  

       UTF-8の最大の特徴はASCIIコードは、まったく同じエンコーディングが行われ ることです。 
       つまり通常のASCII文字列に対してUTF-8を使用した入出力を行うことができる わけです。 
       ファイル名やドメイン名などASCIIコードの範囲で定義される文字列の入出力 に向いているといえるでしょう。  

       java.io.DataInput、java.io.DataOutputにデータ入出力にUTF-8の入出力機能が定義されています。

      •  UTF-8のエンコーディングは以下のような特徴を持っています。  

           
        • ASCIIコード(\u0~\u7F)は1バイトにエンコードされるので効率が良い 
        • 漢字などのコード(\u800~\uFFFF)は3バイトにエンコードされるので効率が悪い 
          残念ながら日本語は3バイトにエンコードされるためUnicodeをそのまま保存するより効率が悪くなってしまうのです。
    • ローカルPC上で動作する多機能なブログエディター「Windows Live Writer」の正式版が、11月8日に公開された。ワープロソフトのような操作で記事を作成できるほか、すでに公開済みの記事を取得して再編集することもでき、複数ブログサービスの一括管理にも対応している。ブログの記事には画像や表を簡単に挿入できるほか、マイクロソフトの地図検索サービス“Live Search Maps”の地図や、動画共有サービス“Soapbox”の動画を簡単に挿入可能。
    • 「Polaroid Picture」は、任意の画像をポラロイド写真風に加工してブログ記事に挿入できるプラグイン。画像にはポラロイド写真風に白い縁がつくほか、やや手前に浮いたような影がつけ加えられる。 

        また、右回り・左回りに最大10度まで画像を傾ける機能を備えており、無造作に配置したかのような演出を加えることもできる。さらに、画像の下部には説明文をつけ加えることも可能。説明文のフォントは任意のものを指定できるので、「あずきフォント」や「ふい字」などの手書きフォントを使って温かみを加えてみるのも楽しいだろう。

    4 more annotations...

      • First of all, thanks for all the feedback people have sent in — we really appreciate it.

         

        Our first priority is to fix all the bugs, and once the app is stable and bug-free start looking at adding new features.  Here are a few notes about the bug fixes, source code, getting involved, roadmap, and when to expect an update.

         

        Bugs

         

        We’ve identified two bugs which are now being fixed:

         
           
        1. Certain multi-byte characters (ex: Æ, Ø, Å ) cause the app to crash and make it impossible to add a blog
        2.  
        3. The way the app creates theme previews is interfering with a plugin which causes a one-time blank post to be published to Twitter and possibly to 3rd party RSS services
1 - 8 of 8
20 items/page
List Comments (0)