Transkripsiyon nedir?

Transkripsiyon nedir

Bu makale, transkripsiyonun tanımını, manuel ve otomatik transkripsiyon yöntemlerini, otomatik transkripsiyon yazılımıyla nasıl daha doğru transkripsiyon elde edilebileceğine ilişkin ipuçlarını ve gözden geçirme ile düzenleme süreçlerini hızlandırmaya yardımcı olan araçlar hakkında ayrıntılı bilgileri içermektedir.

 

  1. Transkripsiyon nedir?
  2. Manuel Transkripsiyon
  3. Transkripsiyon Yazılımı nedir?
  4. Otomatik Transkripsiyon nedir?
  5. Otomatik Transkripsiyon Yazılımının Faydaları
  6. İnsana Karşı Otomatik Transkripsiyon Hizmetleri: Hangisini Kullanmalı?
  7. Otomatik Transkripsiyon ile Daha Doğru Transkripsiyon Nasıl Elde Edilir?
  8. Gözden Geçirme ve Düzenleme Sürecini Hızlandırmak İçin Araçlar

 

Transkripsiyon Nedir?

 

Kelime olarak transkripsiyon birçok farklı alanda kullanılmaktadır, ancak dilbilimde konuşmayı metne dönüştürme (deşifre etme) sürecini tanımlar. Ses transkripsiyonu, metin içeren bir transkript dosyası elde etmenizi sağlar. Bu tür bir çalışmaya genellikle röportajları, seminerleri, toplantıları, konferansları, yuvarlak masa toplantılarını yazıya dökmek, videolara altyazı eklemek vb. için ihtiyaç duyulur. Konuşmayı metne dönüştürmek karmaşık bir süreçtir ve bireylerin hıza, dil bilgisi bilgisine, sabra ve ayrıca hızlı yazma becerisine sahip olmasını gerektirir. Transkripsiyon, araştırmacılar, gazeteciler, akademisyenler, öğrenciler tarafından kullanılır ve manuel olarak veya otomatik transkripsiyon yazılımı kullanılarak yapılır.

Transkripsiyon, profesyonel ve akademik amaçlar doğrultusunda birçok çeşitli endüstriler ve uzmanlar tarafından kullanılır. Temel olarak, sözlü bilgileri yazılı bir forma dönüştürmesi gerekli olan herkesin transkripsiyona ihtiyacı vardır. Bunlardan bazıları:

 - Araştırmacıların, tez hazırlayan öğrencilerin ve pazarlamacıların çok fazla sayıda sesli veya görüntülü röportajı analiz etmeleri gerekmektedir. Analiz yapabilmesi ve verilerden çeşitli istatistikler ve içgörüler elde edilebilmesi için sözlü verilerin kopyalanması bir gerekliliktir.

- Gazeteciler muhtemelen herkesten daha fazla röportaj yapmaktalar. Yaptıkları röportajlarıysa genellikle metin biçiminde yayınlamaktalar, bu nedenle ses dosyalarının transkripsiyonu olmazsa olmazdır.

- Sağlık, İK ve satış profesyonellerinin raporlama için yaptıkları görüşmeleri yazıya dökmeleri gerekmektedir.

- Videolar, podcast'ler, filmler, TV şovları yapan medya yapım şirketleri, altyazılar oluşturmak amacıyla transkriptleri kullanmaktadır.

- Devlet kurumlarının ve şirketlerin toplantılarını, arşivleme ve raporlama vb. gereklilikler için yazıya dökmeleri gerekmektedir.

 

Manuel Transkripsiyon

 

Transkripsiyon işlemini kolaylaştıran yazılım ve araçları kullanarak dosyayı kendiniz yazabilirsiniz, ki bu süreç oldukça uzun bir zaman alacaktır (her kayıt saati için, profesyonel transkriptçi en az 4 saat çalışması gerekmektedir ve yeni başlayanlarsa çok daha fazlasına ihtiyaç duymaktadır). Bu yöntem çoğu durumda olması gereken hızı sağlamaz.

Alternatif olarak, transkripsiyona sizden daha az zaman harcayacak deneyimli bir transkriptçi kiralayabilirsiniz, ancak yine de bir saatlik kayıt için birkaç saatlik çalışma yapması gereklidir. Ayrıca, yüksek miktarlarda paranıza mal olacaktır ve acil transkripsiyon daha pahalıdır.

 

Transkripsiyon Yazılımı Nedir?

 

Transkripsiyon yazılımı, insanların konuşmayı metne dönüştürmelerine yardımcı olan bir bilgisayar programıdır. Kullanıcıya ses parçasını çalmaları/duraklatmaları ve konuşulanları metne dökmeleri ve ardından tüm ses için işlemi tekrarlamaları için araçlar sağlanır. Transkripsiyon yazılımının ana bileşenleri, oynatma, duraklatma, geri sarma, oynatma hızını değiştirme ve diğer işlevlerin yanı sıra metin editörüne sahip bir ses oynatıcısıdır. Yazılım, oynatma/duraklatma için ayak pedalları ve kulaklıklar gibi özel donanımlarla birlikte kullanılabilir. Yazılım, toplantılar, röportajlar, konferanslar gibi her türlü konuşma kaydının transkripsiyonu ve videolara altyazı eklemek için kullanılır. İkinci durumda, metinlere zamanlama bilgileri de eklenir.

Tüm bu araçlar, kullanıcıya transkripsiyon sürecinde yardımcı olurken, en çok zaman alan kısmı - sesi dinleme ve metni manuel olarak yazma - hızlandırmazlar. Profesyonel bir transkriptçi 1 saatlik sesi yazabilmek için halen 4 saate ihtiyaç duyarken, profesyonel olmayanların 6-7 saate ihtiyacı olabilir. Otomatik transkripsiyon yazılımının da yardımcı olduğu yer tam bu noktadır.

 

Otomatik Transkripsiyon Nedir?

 

Otomatik transkripsiyon yazılımı, konuşmayı kısa sürede makul bir doğrulukla otomatik olarak metne döken ve transkriptin daha kolay gözden geçirilmesi ve düzenlenmesi için entegre ses çalarlı bir metin editörü sunan konuşma tanıma teknolojisine (konuşmadan-metne) sahiptir. Konuşmayı metne aşağıdaki şekillerde yazmak için harcanan zaman ve emeği önemli ölçüde azaltır:

  • Ses, çok kısa sürede %85-90 doğrulukla (kaliteli ses için) otomatik olarak metne dökülür ve geriye kullanıcının incelemesi ve hata düzeltmesi kalır.
  • Özel metin editörü, metnin seçilen herhangi bir kısmına ait ses parçasını oynatır, inceleme ve düzeltme işlemini kolaylaştırır.
  • Zaman damgaları her kelime için otomatik olarak belirlenir, böylece altyazılar kolayca çıkarılabilir.
  • Ses oynatılırken, oynatılan her kelime daha kolay görüntülenebilinmesi için transkripsiyonda vurgulanır.

 

Otomatik Transkripsiyon Yazılımının Faydaları

 

Lansmanından bu yana, otomatik transkripsiyon yazılımı kullanıcılara fayda sağlayan birçok önemli özellik getirdi.

Detayları Yakalar

Yanınızda bir defteriniz olabilir, fakat önem teşkil eden tüm bilgileri yazmanız pek muhtemel değildir. Dikkatiniz bir şeyler tarafından dağıldığı için öğretmenin okumanızı önerdiği bir kitabı veya yazarı, toplantıda kaçırdığınız bir bilgiyi hatırlamanız gerekebilir. Not defterinize bakarsınız fakat bilgi orada yazmıyordur. Endişelenmenize hiç gerek yok. Otomatik transkripsiyon yazılımı en başından en sonuna kadar tüm sesi metne döker yani bütün detayları içerir. Bu sayede istediğiniz herhangi bir kelimeyi/konuyu bulabilirsiniz. Aynı zamanda yapacaklarına dikkati dağılmadan belirli bir süreden fazla odaklanamayan dikkat süresi kısa olan bireylere de yardımcı olur.

Anahtar Kelime Araması

Ses dosyanızın tüm transkripsiyonuna sahip olacağınızdan kolaylıkla metnin içinde anahtar kelime araması (Ctrl+F) yaparak gezinebilirsiniz. Bu özellik sayesinde kayıt esnasında kaçırdığınız noktaları yakalayabilirsiniz. İlaveten, hatırlamaya çalıştığınız başlıkla ilintili herhangi bir cümleye tıkladığınızda o cümlenin ses kısmını oynatabilirsiniz.

Zaman ve Paradan Tasarruf Ettirir

kaydın transkripsiyonunu kendiniz veya bir insan transkripçi tutarak yapmayı deneyebilirsiniz. Bu yazılım sayesinde bir saatlik bir dosyayın transkriptini bir saatten az bir sürede ve daha az bir maliyetle çıkarabilirsiniz.

Farklı Konuşmacıları Tanır

Yazılım konuşmacı ayrıştırma teknolojisiyle çalışmaktadır. Odadaki kişi sayısını belirleyebilmektedir. Bu sayede, ilgili sahiplerine göre alıntılama yapmakta zorluk çekmezsiniz. Emin olmanız gereken tek şey kayıt kalitesinin iyi olmasıdır.

Etkinliğin özetinin çıkarılmasına yardımcı olur

Transkript, etkinliğin belgelenmiş bir beyanıdır ve etkinlikte konuşulan bütün ayrıntıları içermektedir, bu da sesi dinlemek için çok fazla zaman harcamadan etkinliğe genel bir göz atılmasını mümkün kılar.

Hızlıca yayımlamanızı sağlar

Araştırmacılar, gazeteciler ve röportaj transkripsiyon hizmetlerinin diğer kullanıcıları, orijinal çalışmalarını başkalarından önce mümkün olan en kısa sürede yayımlamalıdır. Nitel bir çalışma, örneğin, saatlerce süren sesli/görüntülü görüşme ve gözlemlerin transkripsiyonunu gerektirir. Bunları manuel olarak yazmak veya profesyonel bir transkriptçiyi işe almak oldukça yavaş ve pahalı olabilir, otomatik transkripsiyon bu süreci birkaç kat hızlandırır.

Büyük ses/video arşivlerinin transkripsiyonunu yapar

Haberler, TV ve radyolarda, binlerce saatlik ses/video kayıtlarında anahtar kelime araması gerekir. Çağrı merkezleri, kalite değerlendirmesi ve istatistikler için devasa sesli arama arşivlerinin dökümlerine ihtiyaç duyar. Otomatik transkripsiyon, manuel olarak yazılması imkansız olan büyük veri arşivlerini erişilebilir hale getirir.

Ses/videoları engelliler için erişilebilir yapar

Konuşma tanıma teknolojisi, otomatik olarak oluşturulan dökümde yer alan her kelime için zaman damgası koyabildiğinden, video altyazıları kolayca çıkarılabilir. Otomatik olarak oluşturulan altyazılar her zaman mükemmel olmasa bile işitme engelli kişiler için hiç olmamasından çok daha iyidir. Bu nedenle, bazı diller için YouTube gibi bazı video barındırma sağlayıcılarında otomatik altyazı hizmeti halihazırda kullanılmaktadır.

Hassas bilgileri korur

Bazı şirket toplantıları, psikolojik danışma oturumları veya sağlık araştırma görüşmeleri, transkripsiyon yapan kişilerle paylaşılamayan hassas bilgileri içerebilir. İnsan transkriptçiler, kişisel veya gizli bilgilerin ifşa edilmemesi için Gizlilik Sözleşmesi ve benzeri diğer sözleşmeleri imzalasa da, birçok hasta ses kayıtlarının üçüncü bir kişi tarafından dinlenmesinden rahatsızlık duymaya devam etmektedir. Otomatik transkripsiyon yazılımı, transkripsiyon sürecine kullanıcı dışında hiç kimsenin dahil olmamasını ve verilerin şifreyle koruma altında olmasını sağlamaktadır. Ayrıca, Avrupa Birliği Genel Veri Koruma Tüzüğü (GDPR) ile uyumlu otomatik transkripsiyon hizmeti sağlayıcıları, kullanıcının verileri metne dökmeyi bitirip silmesi halinde (web arayüzünden veya destek ekibinden silmesini isterse) hiçbir kayıt bırakmaksızın sunuculardan tüm verilerin silinmesi konusunda yasalarca zorunlu tutulmaktadır.

  

İnsana Karşı Otomatik Transkripsiyon Hizmetleri: Hangisini Kullanmalı?

 

Büyük miktarda talep, bilgi ve oluşturulacak içerik olunca manuel transkripsiyon oldukça fazla zaman ve emek gerektirir. Otomatik transkripsiyon yazılım programları her ne kadar popülerlik kazanıyor olsa da, manuel transkripsiyon halen birçok alanda yoğun olarak kullanılmaktadır.

Manuel transkripsiyon, teknolojiden ziyade bireylerin hizmetlerini kullanmaktır. Bu, ses dosyasını dinleyerek ve metni daha yüksek doğrulukla yazarak yapılır. Buna karşılık, otomatik transkripsiyon yazılımı, sesi otomatik olarak metne dönüştüren otomatik konuşma tanıma teknolojisini (ASR) kullanır. Farklı faktörlere bakalım ve her iki hizmetin de nasıl performans gösterdiğini görelim.

Hız ve verimlilik

Söz konusu hız olduğunda, otomatik yazılım şüphesiz en önde olandır. Otomatik transkripsiyon hizmetleri, aynı ses dosyası için birkaç güne ihtiyaç duyabilecek insan transkriptçilerine kıyasla, birkaç dakika içinde transkripsiyon sağlar.

Doğruluk

İnsanlar transkripsiyonda daha doğrudur (İleride bu değişebilecek olsa da). Teknoloji her zamankinden daha gelişmiş olsa da, ASR bu süreçte halen bazı hatalar yapabilmektedir. Bunun başlıca nedenleri kayıtta birtakım ağır aksanlar veya lehçeler, gürültülü arka plan veya aynı anda konuşan çok fazla insan olmasıdır. Otomatik transkripsiyon yazılımının bir başka olası dezavantajıysa, cümle doldurma kelimelerini veya önemli olmayan tekrarlanan kelimeleri de gösterebilmesidir. İnsan transkripsiyonu, transkripsiyon işlemi sırasında bu doldurma kelimelerini eler.

Maliyet

Maliyet, insanların otomatik transkripsiyon hizmetlerini tercih etmelerinin esas nedenlerinden biridir. Otomatik transkripsiyon hizmetlerini kullanarak insan hizmetine kıyasla oldukça daha az miktarda para ödersiniz. Özellikle yazılması gereken çok sayıda ses dosyanız varsa, bu önemli miktarda para demektir. Bazı otomatik servislerin size ücretsiz bir plan verebileceğini de belirtmekte fayda var. Yazılımı ücretsiz olarak test edebilir veya kısıtlı zaman limitleri ile düzenli olarak kullanabilirsiniz. Öte yandan, sesi profesyonel olarak nasıl yazacağını bilen transkriptçiler bulmak da epey zordur. Piyasada insan transkriptçisi bulma konusunda artan bir sıkıntı mevcut ve bir hizmeti verebilecek kişi sayısı daha az olduğunda, maliyetler de o denli yüksek olabilmektedir.

Bilgi güvenliği

Yukarıda belirtildiği gibi, üçüncü bir tarafa veya insan transkriptçiye vermek istemediğiniz hassas bilgileriniz varsa transkripti kendiniz hızlı bir şekilde oluşturmak adına otomatik yazılımı kullanabilirsiniz.

Özetleyecek olursak, herhangi bir hizmetin seçilmesi, o hizmetin beraberinde gelen özelliklerine bağlıdır. Doğruluk en büyük önceliğinizse ve zaman ve maliyet konusunda fazla kaygınız yoksa, insan hizmetini seçmelisiniz. Bu aynı zamanda, otomatik transkripsiyon hatalarının çok olacağı ve düzenleme yapmanın sıfırdan manuel olarak transkripsiyonunu yapmaktan daha zor olacağı düşük kaliteli veya gürültülü ses kayıtları için de geçerlidir. Ses kaliteniz yeterince iyiyse ve çok daha uygun maliyetli ve zaman açısından verimli bir hizmet istiyorsanız, seçmeniz gereken hizmet otomatik transkripsiyondur.

 

Otomatik Transkripsiyon ile Daha Doğru Transkripsiyon Nasıl Elde Edilir?

 

 Her ne kadar Otomatik transkripsiyon yazılımı ses dosyalarını yazmayı kolaylaştırsa da, doğru bir transkript elde etmek için bazı adımların yapılması gereklidir. Röportajı, odak grup tartışmasını, toplantıyı vb. kaydeden kişi kayıt sürecinde aşağıdakileri yapmalıdır:
Kayıt cihazının sağlam olduğundan ve herşeyiyle tam çalıştığından emin olun. Sesleri kaydetmede sorun yaşanmaması gerekmektedir, bu nedenle mikrofonların iyi durumda ve temiz olması önemlidir. Bir deneme kaydı yapın ve kayıt kalitesinin yüksek olduğundan emin olabilmek için dinleyin. Ayrıca görüşmenin eksiksiz kaydedilebilmesi için için kayıt cihazı yeterli pil ve belleğe sahip olmalıdır.

Mikrofon, konuşmacıya yakın olmalı, en fazla bir veya iki metre uzaklığında olmalıdır. Bu nedenle, sınıfın en arka sırasında oturup, ses kaydeden bir öğrenciyseniz, otomatik transkripsiyon yazılımından yüksek doğruluk beklemeyin. Kayıt cihazını elinizde konuşmacıya yakın tutabilir veya önündeki masanın üzerine koyabilirsiniz. Birden fazla sayıda konuşmacı varsa, herkesin mikrofona yakın olabilmesi adına bir masanın etrafında veya yuvarlak bir şekilde oturmaları en iyisidir. Büyük toplantılarda veya konferanslarda, konuşmacılar kendi yerlerinden konuşmak veya soru sormak yerine mikrofona gelmeli ve konuşmalıdır. Konferans salonlarında olduğu gibi toplantıdaki herkes için ayrı bir mikrofona sahip olmak ve ayrı ses kanallarında ses kaydı yapmak en iyisidir.

Aynı anda yalnızca bir konuşmacının konuştuğundan emin olun. Şu anda olduğu gibi aynı anda iki veya daha fazla kişi konuşuyorsa, otomatik transkripsiyon doğruluğu önemli ölçüde düşer; bu, konuşma tanıma alanının en büyük araştırma zorluklarından biridir.

Arka plan gürültüsü ve yankı seviyesi, kayıt kalitesinde önemlidir ve dolayısıyla transkriptte çok önemlidir. Kaydı mümkün olduğunca az arka plan gürültüsü olan sessiz bir yerde yapmaya çalışın. Kalabalık ortamlarda, arka planda müzik olan veya yankılı geniş odalarda röportaj yapmaktan kaçınılmalıdır.

Transkripsiyon işlemi ister manuel ister otomatik olarak yapılacak olsun, bu adımların takip edilmesi, kaliteli bir transkriptte ana faktör olan kaliteli bir kayıt almaya olanak tanır. Ses kalitesi düşükse, insan transkripsiyon hizmeti almak bile size çok daha pahalıya mal olur.

 

Gözden Geçirme ve Düzenleme Sürecini Hızlandırmak İçin Araçlar

 

Otomatik transkripsiyon yazılımını kullanarak dosyanızı yazıya dökmenin ilk adımı, ses veya video dosyanızı yüklemek ve konuşma-metin teknolojisi ile otomatik olarak yazıya dökmektir. Genellikle, ses dosyasının süresinden daha az sürer. Ardından, taslak transkripsiyon, entegre ses oynatıcıyla özel metin düzenleyicide açılır. Ses oynatıcı, metindeki her kelimenin zamanlamasını bilir. Voicedocs Transkripsiyon Düzenleyicisinde transkripsiyonu iki şekilde gözden geçirebilir ve düzenleyebilirsiniz:

  1. Ses oynatıcının Tümünü Oynat özelliğini kullanabilirsiniz. Ses oynatılırken, oynatılan her kelime metinde vurgulanır, böylece yanlış yazılan kelimeler olup olmadığını kolayca görebilirsiniz. Kelimeye tıkladığınızda ve düzenlediğinizde oynatma duraklar, daha sonra bu bölümden itibaren yine oynatmaya devam edebilirsiniz.
  2. Klavyedeki Ok düğmelerini kullanarak metin içinde gezinebilirsiniz. İmlecin etrafındaki her metin parçası otomatik olarak oynatılır, böylece hata olup olmadığını görebilirsiniz. Yeni bir parçaya her geçtiğinizde parçaya geçtiğinizde o parçanın sesi otomatik olarak oynatılır. Parça uzunluğu araç çubuğundan değiştirilebilir. Seçili parça Ctrl+Space tuşlarına basarak tekrar çalınabilir.

Her iki yöntemde de daha hızlı gözden geçirmek için ses çalma hızını Araç Çubuğu'ndan değiştirebilirsiniz. Yapılacak en iyi şeylerden biri de, son bir inceleme yapmak için tüm düzenlemeleri bitirdikten sonra bütün sesleri baştan sona yeniden oynatmaktır.
Düzenledikten ve inceledikten sonra Dışa Aktar düğmesine basabilir ve metni DOC, TXT, SRT veya JSON gibi farklı formatlarda cihazınıza indirebilirsiniz. Ayrıca dökümü indirirken her cümle için zaman damgası ekleyebilirsiniz.

Videolara altyazı eklenmesinde daha fazla özelliğe sahip olan altyazı düzenleyici aracına ayrı bir makalede değinilecektir.