Ses ve video dosyalarını deşifre programları hangi tür ses kayıtları için iyi çalışıyor?

Ses ve video dosyalarını kaliteli şekilde deşifre eden bilgisayar programlarının ortaya çıkmasından sonra, bunların deşifreye ihtiyac duyan kullanıcılar arasında hızlı bir şekilde yayılması bekleniyordu. Bu tür kullanıcıların arasında deşifre programlarınadaha fazla ihtiyaç duyabilecek profesyonel deşifrecilerin olacağıdüşünülürdü.
Kaliteli otomatik deşifre programları, profesyonel deşifrecilerin işlerini kolaylaştırmak ve bunun sonucunda da işgücü verimliliğini ve karı artırmak gibi konularda yardımcı ola bilir.
Ancak bazı durumlarda, ses ve video dosyalarını otomatik deşifre programları çok iyi sonuclar vermez və bu nedenle deşifrecilerin uzun bir süre böyle bir deşifre türüyle çalışması gerekir.
Peki bu uygulama ne zaman iyi sonuçlar veriyor? Bu programların kabul edilebilir sonuç verip-vermeyeceğini önceden bilmek mümkün mü?
Bu makalede bu soruları yanıtlamaya çalışacağız. Aşağıda otomatik deşifre programlarının işe yaramaz olmadığını göstereceğiz. Sadece, bu programları ustaca kullanmıyoruz.
Otomatik deşifre programına yüklenmeden önce, öncelikle ses dosyasının kayıt kalitesi değerlendi­rilme­lidir. Ses dosyasının kayıt kalitesi bizim açıdan ne demekdir?
Ses dosyaları (Deşifre/Algılama yönünden), kayıt kalitelerine göre üç farklı gruba ayrılabilir:

1. Grup Ses kaydında  konuşmacı net sesle konuşuyor.
2. Grup  Yuvarlak masada yapılan bir konuşmanın veya bir kaç kişinin aynı anda konuştuğu, birbirinin lafını böldüğü ya da kesik cümlelerle konuştuğu bir tartışmanın ses kaydı
3. Grup Ses dosyası, algılaması güç olan bir konuşma içermektedir. Bir konuşmanın algılanmasının güç olmasının bir çok nedeni olabilir, örneğin kaydı yapan mikrofonun konuşmadan uzak olması veya yakında  güçlü bir gürültü kaynağı bulunması gibi.
Her bir ses kaydı ya bu gruplardan birinin parçasıdır, ya da bu grupların parçacıklarından (fragmanlarından) oluşur. Örneğin, ses kaydı nitelikli parçacıklar (birinci grup) ve örtüşen parçacıklar (ikinci grup) ve duyması güç parçacıklar (üçüncü grup) içerebilir.
1. gruba ait tüm ses dosyaları, otomatik deşifre programı ile birlikte kaliteli  metinlere dönüştürülebilir. Muhtemelen çok az sayıda hata içeren ve kaliteli bir şekilde deşifre edilmiştir bir metin alacağınızdan emin olabilirsiniz. Ses dosyası birden fazla konuşmacı içeriyor olsa da, birbirlerinin sözlerini kesmedikleri sürece kaliteli bir deşifre elde edilecektir. Burda önemli olan seslerin birbirlerini kesmemesidir. (Çizim 1)

 



Çizim 1 Konuşmacılar birbirinin sözünü kesmiyor.

Ses kaydının üst üste binmiş seslerden oluşması durumunda (yani, herkesin aynı konuşması, birbirinin sözünü kesmesi durumunda), bu ses kaydı otomatik deşifreye tabi değildir. (Çizim 2) Bu tür ses kayıtlarıyla çalışmanın deşifreciler için de zor olacağı belirtilmelidir, bu tür ses kayıtlarını deşifre etmek  çok zaman almaktadır.

 

 

 

Çizim 2 Konuşmacılar birbirinin sözünü kesiyor (Herkes aynı anda konuşuyor)

Aynı şey, uzak bir mikrofonla kaydedilen bir ses kaydı için de söylenebilir, bu durumda da konuşan kişinin konuşmasını ayırt etmek zor olacaktır. Bu durumlarda, sadece bir kişi bile konuşuyor olsa da otomatik deşifre programlarının yardımı dokunmayabilir. Ve deşifreciler için bu gibi bir ses kaydını deşifre etmek, tıpkı önceki durumda olduğu gibi zor olacaktır. (Çizim 3)

 

 

Çizim 3. Konuşmacının konuşması zar zor duyulmaktadır.

Son olasılık ise eğer ses kaydının her üç grubun parçacıklarından oluşması durumudur - yani ses hem normal hem de empoze edilmiş ve zar zor tanınabilir parçacıklar içeriyorsa - Bu durumda, parçacıklar farklı şekillerde deşifre edilir. Ses kayıtlarının 1. gruba ait olan parçacıkları otomatik deşifre programları tarafından normal bir şekilde deşifre edilecektir ve diğer parçacıklar muhtemelen doğru olmayacaktır. (Çizim 4)

 

 



 

Çizim 4 Ses kaydı ayrı ayrı parçacıklardan oluşmaktadır.

Bu çizimde ses kaydı, ayrılmış parçacıklardan (fragmanlardan) oluşur.  I, III ve V parçacıkları "kötü" parsellere sahip değildir ve bu nedenle deşifre programı doğru metni verecektir. II ve IV parçacıkları ise muhtemelen doğru deşifre edilmeyeceklerdir.

Bu durumda otomatik deşifre programın kullanımı, deşifrecilerin işini kolaylaştırmaktadır. (Eğer özel bir düzenleyici Voicedocs kullanıyorsanız).
Bu kısa analizden, bazı durumlarda (çizim 1 ve 2) ses/video deşifre programının, kişinin zaman ve paradan tasarruf etmesine yardımcı olabileceği sonucuna varabiliriz.
Kişi sadece, bu güçlü aracı ne zaman kullanacağını önceden bilmelidir.
Bir sonraki makalede, deşifre programının hızlı ve niteliksel bir metne sahip olması için konferans ses kaydının alınması üzerine konuşacağız.