2010年 02月 03日
耳で聞いて文字にする
|
昨日はココでちょろっと書いた就業体験の評価会でした。項目別に簡単な評価が書かれた個別の評価表をもらって、後は全体的にどういうところが間違えが多かったか、指示通りの表記などにされているか、指示の範疇を超えて手を加え過ぎていないかなどを講師の先生に説明を受け、修了証書なるものを頂いて来ました。と言っても、約2週間の納期でやさしめの課題2つを納品しただけなんですけれど(笑)。
でも、こういうのは'なんちゃって'だろうと'さわり'だろうと、実際に自分でやってみることが出来る機会というのもなかなかないので、「こんな場合はどーしよ?」とズブの素人なりに悩みながらでしたけど、なかなか面白かったです。
評価の対象になった課題は17分程度のインタビューをテキストに起こすというもので、文字にすると結構あるんですね。で、セミナー参加者80名ほどの中で、テープ起こしの就業体験を希望した人は20人くらいいたと思うので、先生もプロとは言え一字一句全部に目を通すのは大変ですよね。
提出課題の仕様は、テキストファイルで指定日までに指定のサーバーへファイルを送信することのほか、
・入力方法 --- 句読点は「、」「。」を使用、「?」「!」は使わない。
数字は1桁全角、2桁以上半角。英字は略語的なものは全角、
単語的なものは半角。
・起こし方 --- ケバ( 「えー」「そのー」といった無意味な言葉)を取る。
倒置を直す、助詞を直す/補う。
くずれたしゃべり言葉を整える(ら抜き言葉・い抜き言葉など)。
聞き取れない部分や確信のない部分は指定の入力処理をする。
・表記 --- 今回は表記にこだわり過ぎる必要はないが、漢字は常用漢字表の範
囲を使用。「こと」「もの」「わけ」などは形式名詞的に使う場合はひら
がな、「出来事」「言い訳」など一般用語のときは漢字。
なので、「素起こし」「ケバ取り」「整文」の、ケバ取りはしてもキッチリとは整文しないって感じでしょうかね。この、どこまで整えるのかってとこが私的には1番迷ったところ。
私の個別評価シートで減点されていたのは、「凄く」「漕ぐ」などを使用してしまったので減点。誤入力で「人工の築山」ということろを「人口の」に、「バドミントン」を「バトミントン」にしてしまったので減点。「こぢんまり」を「こじんまり」としたのもダメ。い抜き言葉も1ヵ所残っていたので減点・・・と、全体評価でB(笑)。
先生いわく、今回はAとCが少なくてBの人が多かったとのことなので、まぁ平均的な出来なさ度(笑)だったみたいです。聞き取りは正確で、知らない言葉(地名や施設名など)の調査も良く出来ているとコメントにあったのが救いでしょうか(笑)。
最初に音声を聞いて話している通りにテキストに起こしてみて、それからテキストを読みながら不要な言葉を取り除いたり直したりしていったんですけれど、「この言葉は漢字か?ひらがなか?」「常用漢字か?常用漢字外か?」といちいち引っ掛かってしまって、その度に調べるのでもー大変(笑)。その上、インタビューは話言葉なので、「~けれども、~とか、~けれども、みたいな、~けれども、・・・です。」みたいな切れ目のない会話の上に、主語と述語のあいだにどんどんと補足説明みたいな言葉が挟まれ、「当然」とか「非常に」といった合いの手みたいな(多分口癖)も入って、語順がバラバラなんですよね。「この'非常に'はどの言葉にかかるんだ?」みたいな。
でも、ライターではないのでそこまで考える必要はなく(場合によってはあるけれど)、とにかく聞いたことを忠実に再現する、話者がそう話してるんだからそうなんだ、というところに戻ろうとするんですけれど、それがやっぱり気になってしまうんですよねぇ・・・。
ら抜き言葉・い抜き言葉も気をつけなくちゃと思って注意はしていたものの、「やっぱり」とか「~んですけど」とか「~だったんですけど」とか話し言葉を読んでるうちに、注意力が薄れて「~してるんで」とか「~なってるんで」とかスルーしてしまったり。普段から私自身がそういう言葉を使ってるから敏感に引っ掛からないってことなんですよね、きっと。山は'下りる'か?とか、'きれい'は綺麗か奇麗かきれいか?裸足は'はだし'か?とか、そんなのばっかり(笑)。
因みにプロの方は、仮名使いや同音異義語、略語の正式名称などが収められている辞書、共同通信社の「記者ハンドブック」や速記協会の「用字用例辞典」などを暗記する勢いで使い、PCには大量の用語を登録しているとのこと。
今回、音声を聞いてテキストに起こすということ自体もなかなか面白かったんですけれども、それよりも「私も喋る時はこんなにめちゃくちゃな語順で話しているのだろうな」と思うと、ちょっとゾッとしてしまいました。最初はテープを聴いて、「こりゃぁ、倒置じゃなくて語順がめちゃくちゃだろー」と思ったんですけれど、ふと考えてみると私もそういう喋り方をしてるんですよね、きっと。喋り言葉だからそういうものだとは言っても・・・ねぇ。イカンなと。
耳で聞けばそんな語順がめちゃくちゃな話でも理解出来るけれど(聞いたその場だけ理解できた(気になる)ってこともあるけれど)、それを文字にして目で読むと何が何だかわからなくなるってのは不思議だなとも。耳で聞くときは漢字も送り仮名も句読点も関係なく、音だけを理解すればいいからなんでしょうかね。人間の耳というか頭ってすごいなぁって。いや~、色々な意味で面白い経験が出来ました。
でも、こういうのは'なんちゃって'だろうと'さわり'だろうと、実際に自分でやってみることが出来る機会というのもなかなかないので、「こんな場合はどーしよ?」とズブの素人なりに悩みながらでしたけど、なかなか面白かったです。
評価の対象になった課題は17分程度のインタビューをテキストに起こすというもので、文字にすると結構あるんですね。で、セミナー参加者80名ほどの中で、テープ起こしの就業体験を希望した人は20人くらいいたと思うので、先生もプロとは言え一字一句全部に目を通すのは大変ですよね。
提出課題の仕様は、テキストファイルで指定日までに指定のサーバーへファイルを送信することのほか、
・入力方法 --- 句読点は「、」「。」を使用、「?」「!」は使わない。
数字は1桁全角、2桁以上半角。英字は略語的なものは全角、
単語的なものは半角。
・起こし方 --- ケバ( 「えー」「そのー」といった無意味な言葉)を取る。
倒置を直す、助詞を直す/補う。
くずれたしゃべり言葉を整える(ら抜き言葉・い抜き言葉など)。
聞き取れない部分や確信のない部分は指定の入力処理をする。
・表記 --- 今回は表記にこだわり過ぎる必要はないが、漢字は常用漢字表の範
囲を使用。「こと」「もの」「わけ」などは形式名詞的に使う場合はひら
がな、「出来事」「言い訳」など一般用語のときは漢字。
なので、「素起こし」「ケバ取り」「整文」の、ケバ取りはしてもキッチリとは整文しないって感じでしょうかね。この、どこまで整えるのかってとこが私的には1番迷ったところ。
私の個別評価シートで減点されていたのは、「凄く」「漕ぐ」などを使用してしまったので減点。誤入力で「人工の築山」ということろを「人口の」に、「バドミントン」を「バトミントン」にしてしまったので減点。「こぢんまり」を「こじんまり」としたのもダメ。い抜き言葉も1ヵ所残っていたので減点・・・と、全体評価でB(笑)。
先生いわく、今回はAとCが少なくてBの人が多かったとのことなので、まぁ平均的な出来なさ度(笑)だったみたいです。聞き取りは正確で、知らない言葉(地名や施設名など)の調査も良く出来ているとコメントにあったのが救いでしょうか(笑)。
最初に音声を聞いて話している通りにテキストに起こしてみて、それからテキストを読みながら不要な言葉を取り除いたり直したりしていったんですけれど、「この言葉は漢字か?ひらがなか?」「常用漢字か?常用漢字外か?」といちいち引っ掛かってしまって、その度に調べるのでもー大変(笑)。その上、インタビューは話言葉なので、「~けれども、~とか、~けれども、みたいな、~けれども、・・・です。」みたいな切れ目のない会話の上に、主語と述語のあいだにどんどんと補足説明みたいな言葉が挟まれ、「当然」とか「非常に」といった合いの手みたいな(多分口癖)も入って、語順がバラバラなんですよね。「この'非常に'はどの言葉にかかるんだ?」みたいな。
でも、ライターではないのでそこまで考える必要はなく(場合によってはあるけれど)、とにかく聞いたことを忠実に再現する、話者がそう話してるんだからそうなんだ、というところに戻ろうとするんですけれど、それがやっぱり気になってしまうんですよねぇ・・・。
ら抜き言葉・い抜き言葉も気をつけなくちゃと思って注意はしていたものの、「やっぱり」とか「~んですけど」とか「~だったんですけど」とか話し言葉を読んでるうちに、注意力が薄れて「~してるんで」とか「~なってるんで」とかスルーしてしまったり。普段から私自身がそういう言葉を使ってるから敏感に引っ掛からないってことなんですよね、きっと。山は'下りる'か?とか、'きれい'は綺麗か奇麗かきれいか?裸足は'はだし'か?とか、そんなのばっかり(笑)。
因みにプロの方は、仮名使いや同音異義語、略語の正式名称などが収められている辞書、共同通信社の「記者ハンドブック」や速記協会の「用字用例辞典」などを暗記する勢いで使い、PCには大量の用語を登録しているとのこと。
今回、音声を聞いてテキストに起こすということ自体もなかなか面白かったんですけれども、それよりも「私も喋る時はこんなにめちゃくちゃな語順で話しているのだろうな」と思うと、ちょっとゾッとしてしまいました。最初はテープを聴いて、「こりゃぁ、倒置じゃなくて語順がめちゃくちゃだろー」と思ったんですけれど、ふと考えてみると私もそういう喋り方をしてるんですよね、きっと。喋り言葉だからそういうものだとは言っても・・・ねぇ。イカンなと。
耳で聞けばそんな語順がめちゃくちゃな話でも理解出来るけれど(聞いたその場だけ理解できた(気になる)ってこともあるけれど)、それを文字にして目で読むと何が何だかわからなくなるってのは不思議だなとも。耳で聞くときは漢字も送り仮名も句読点も関係なく、音だけを理解すればいいからなんでしょうかね。人間の耳というか頭ってすごいなぁって。いや~、色々な意味で面白い経験が出来ました。
by sohla
| 2010-02-03 15:41
| みる・きく・かんがえる
|
Comments(0)