डीथर

ऑड्यासिटी विकासाच्या माहितीपुस्तीकेवरून
येथून जा : निर्देशक, शोधा
"डीथर" हे डिजिटल ध्वनीची बिट खोली कमी करताना उद्भवणाऱ्या परिमाणीकरण त्रुटी (गोलाकार त्रुटी) चे हेतुपुरस्सर यादृच्छिकीकरण आहे. सामान्य अंकगणित गोलाकार चक्रीय नमुने तयार करू शकतात जे कर्कश हार्मोनिक आवाजासारखे ऐकू येतील. बिट-रिडक्शन प्रक्रियेचे ऐकू येण्याजोगे प्रभाव कमी करण्यासाठी डिथर राउंडिंग यादृच्छिक करते. मोठ्या प्रमाणात वाढल्याशिवाय मंद आवाज स्वतः ऐकू येत नाही.

डीथर रचना

ऑड्यासिटीमध्ये आपली प्राथमिकतेच्या गुणवत्तेच्या उपखंडातून नंतरच्या रचना नियंत्रित केल्या जाऊ शकतात.

Dither in Quality Preferences.png

खालील नमुने

डाउनसॅम्पलिंग धारिकेला कमी बिट खोलीमध्ये रूपांतरित करताना किंवा निश्चित वेळेमध्ये जेव्हा ऑड्यासिटी गीतपट्ट्याच्या बिट खोलीपेक्षा कमी बिट खोलीमध्ये ध्वनि प्ले करते तेव्हा होते. ऑड्यासिटी प्रकल्प्सची बिट खोलीच्या गुणवत्ता प्रधान्यावर "पूर्वनियोजित नमूने स्वरूप" वर सेट केली आहे.

डाउनसॅम्पलिंगचे उदाहरण म्हणजे जेव्हा ३२-बिट फ्लोट किंवा २४-बिट प्रकल्प १६-बिट धारिका फॉरमॅटमध्ये निर्यात केला जातो. १६-बिट किंवा २४-बिट गीतपट्ट्यावर प्रक्रिया करताना डाउनसॅम्पलिंग देखील होते कारण ऑड्यासिटी ३२-बिट फ्लोट फॉरमॅटमध्ये प्रक्रिया करते, जी नंतर १६ किंवा २४-बिट गीतपट्टा फॉरमॅटमध्ये रूपांतरित (डाउनसॅम्पल) होते. ३२-बिट फ्लोट फॉरमॅट गीतपट्टा (पूर्वनियोजित) सह काम करून वारंवार डाऊनसॅम्पलिंग टाळता येऊ शकते, त्यामुळे अनावश्यक रूपांतरण नुकसान टाळता येते. ३२-बिट फ्लोट प्रकल्पामध्ये डिथरिंग कधीही लागू केले जात नाही कारण कोणतेही डाउनसॅम्पलिंग होत नाही.

३२-बिट फ्लोट प्रकल्प्सच्या प्लेबॅकच्या वेळी डाउनसॅम्पलिंग होते, कारण ध्वनि इंटरफेस १६-बिट किंवा २४-बिटवर कार्य करतात.

डाउनसॅम्पलिंगची आवश्यकता असलेल्या ऑपरेशन्स करताना ऑड्यासिटीमध्ये वापरल्या जाणार्‍या डिथरचा प्रकार तुम्ही निवडू शकता किंवा तुम्ही ते काहीही नाही असे सेट करून पूर्णपणे बंद करू शकता. डिथर रचना पुन्हा प्राधान्यांच्या गुणवत्ता उपखंडात आहेत. "वास्तविक वेळ डिथर" ची सेटिंग बॅक प्ले करताना केलेल्या डिथरिंगवर लागू होते आणि धारिका लेखन (संपादन किंवा निर्यात) करण्यासाठी "उच्च-गुणवत्तेचे डिथर" साठी लागू होते. "वास्तविक वेळ डिथर" पूर्वनियोजितनुसार असमर्थ केले जाते ("काहीही नाही" वर सेट केलेले), जेणेकरून प्ले आणि ध्वनीमुद्रित दरम्यान संगणक प्रोसेसरवरील भार कमी करता येईल. "वास्तविक वेळ डिथर" सेटिंगचा प्रकल्प ध्वनि माहिती किंवा निर्यात केलेल्या गीतपट्ट्याच्या गुणवत्तेवर कोणताही परिणाम होत नाही.

वर्तुळ पूर्ण करण्याची प्रक्रिया यादृच्छिक करण्यासाठी "आयताकृती", "त्रिकोणीय" आणि "आकार" प्रकारचे डिथर या फक्त भिन्न पद्धती आहेत.. आयताकृती पद्धतीचा विचार डाईच्या रोलप्रमाणे केला जाऊ शकतो - कोणत्याही संख्येची पृष्ठभागाची समान यादृच्छिक संभाव्यता असते. आयताकृती डिथर नॉइजचे वैशिष्ट्य कमी पातळीचे पांढरे आवाज आहे. त्रिकोणी पद्धत आयताकृती आवाजापेक्षा (कधीकधी निळा आवाज म्हटले जाते) शांत, अधिक स्थिर आणि उच्च पिच हिस म्हणून दर्शविली जाते. शेप्ड डिथर म्हणजे काळजीपूर्वक कंटोर केलेल्या फ्रिक्वेंसी सामग्रीसह आवाज आहे जे बहुतेक यादृच्छिकीकरण फ्रिक्वेन्सीवर ठेवते जे आपण कमीतकमी सहजपणे ऐकू शकतो. आकाराचे डिथर हे प्रवर्धनाच्या सामान्य स्तरांवर कमीत कमी ऐकू येण्यासारखे आहे आणि "उच्च-गुणवत्तेचे रूपांतरण" सेटिंगसाठी पूर्वनियोजित आहे.

डीथर निर्यातीवर लागू करा - तपशीलवार स्पष्टीकरण

डीथर केवळ उच्च बिट खोलीपासून कमी बिट खोलीत रूपांतरित करतानाच लागू केले जाते. डब्ल्यूएव्ही किंवा इतर कॉम्प्रेसप्रेस ध्वनि स्वरूपात निर्यात करणे सर्व परिस्थितींमध्ये अक्षरशः हानी नसते. तथापि ऑड्यासिटी प्राधान्यांमधील रचना (खाली पहा) च्या आधारावर काही प्रकारच्या कॉम्प्रेसप्रेस ध्वनि निर्यातसह ध्वनि माहितीमध्ये खूपच लहान बदल होऊ शकतात.

  • ३२-बिट पीसीएम डब्ल्यूएव्ही स्वरूपनात निर्यात करणे १००% हानि रहित आहे - कोठेही डीदरिंग लागू केलेले नाही.
  • २४-बिट पीसीएम डब्ल्यूएव्ही स्वरूपनात निर्यात करणे जवळजवळ -१३० डीबीच्या पीक डीथर लेव्हलसह पातळ केले जाऊ शकते
  • १६-बिट पीसीएम डब्ल्यूएव्ही स्वरूपात निर्यात करणे जवळजवळ -८० डीबीच्या पीक डीथर पातळीसह डीथर केले जाऊ शकते

१६-बिटवर निर्यात करताना, −३२७६८ ते +३२७६७ च्या पट्टीवर जास्तीत जास्त "त्रुटी" +/- ३ असते. १६-बिट ध्वनि या पट्टीवरील सर्वात जवळच्या अंकापर्यंतच अचूक असू शकतो.

२४-बिटवर निर्यात करताना, -८३८८६०८ ते +८३८८६०७ च्या पट्टीवर जास्तीत जास्त "त्रुटी" +/- ३ असते. सध्या, अत्याधुनिक ध्वनि इलेक्ट्रॉनिक्स २४-बिट फॉरमॅटमध्ये विचलित होण्यापेक्षा जास्त अयोग्यता प्रदर्शित करतात.

"चुका" कोठून आल्या आहेत

ऑड्यासिटी ३२-बिट फ्लोट क्रमांकांचा वापर करुन गणना करते, जे अविश्वसनीय अचूकता प्रदान करते (श्रेणी ध्वनि मुखपृष्ठाच्या अगदी उत्कृष्ट शीर्षापेक्षा अगदी चांगले). जर ऑड्यासिटीला रेझोल्युशन १६-बिट पर्यंत कमी करण्याची आवश्यकता असेल तर "राउंडिंग ऑफ" त्रुटी असतील. प्रत्येक नमुना मूल्य घेऊन आणि त्यास जवळच्या १६-बिट मूल्यामध्ये रूपांतरित करून जर साध्या "राउंडिंग" केले गेले तर आउटपुटमधील "स्टेपनेस" परिणाम होईल जे विशेषतः अत्यंत शांत ध्वनींनी ऐकू येईल. हे टाळण्यासाठी, ऑड्यासिटी रूपांतरणात "डीदर" लागू करते - हे बर्‍याचदा ग्राफिक्समध्ये "अँटी-अलायझिंग" ची तुलना केली जाते जे वक्रांच्या सुस्तपणासाठी वापरले जाते. मूल्ये नेहमी जवळच्या १६-बिट मूल्याकडे वळविण्याऐवजी, डीदरिंग केल्यामुळे राउंडिंगमध्ये काही प्रमाणात यादृच्छिकता लागू होते जेणेकरून उद्भवणारे चरण टाळता येतील.

ऑड्यासिटीकडे ३ दिशानिर्देश कसे होते यासाठी ते वैकल्पिक अल्गोरिदम आहेत आणि ते "संपादन यादी > प्राधान्ये > गुणवत्ता" मध्ये आढळतात. त्यानंतरची रचना "उच्च गुणवत्ता रूपांतरण" वर लागू होतात. उपलब्ध पर्याय असे आहेत: काहीही नाही (कोठेही नाही), आयत, त्रिकोण आणि आकार. या रचनामधील फरक खूप सूक्ष्म आहेत आणि कोणताही फरक लक्षात घेण्यासाठी आपल्याला चांगल्या उपकरणांसह काळजीपूर्वक ऐकणे आवश्यक आहे. सामान्यत: "त्रिकोण" किंवा "आकार" सर्वोत्तम (व्यक्तिनिष्ठ) निकाल देईल.

  • जर डीथर "काहीही नाही" वर सेट केले असेल तर नंतर एका साध्या गोलपासून खालच्या थोड्या खोलीत रुपांतरित केले जाईल.
  • जर हे सक्षम केले असेल तर छद्म यादृच्छिक भिन्नता अचूक रूपांतरांवर लागू केली जातील जेणेकरून गोल नेहमीच त्याच दिशेने होत नाही. गोलाकार संख्या सांख्यिकीय दृष्टिकोनातून कमी बिट खोलीवर सर्वात जवळच्या मूल्यामध्ये रूपांतरित होण्याची अधिक शक्यता असते. नमुना मूल्य अचूक संख्येच्या अगदी जवळ असेल तर ते त्या नंबरवर रूपांतरित होण्याची अधिक शक्यता असते. रूपांतरित मूल्यांवर याचा एक गुळगुळीत प्रभाव आहे, परिणामी ध्वनि सिग्नल अगदी साध्या गोलाकारापेक्षा जास्त वाटेल. अत्यंत कमी विस्तारच्या पातळीवर, हे यादृच्छिकरण खूप निम्न स्तराचा आवाज म्हणून ऐकला जाऊ शकतो, परंतु संभाव्यतेच्या वक्रांचे आकार देऊन आणि म्हणूनच आवाजाची वारंवारता मजकूर हे कमी केले जाऊ शकते.
    • आकारातील डीथर (ऑड्यासिटी पूर्वनियोजित) मध्ये अन्य प्रकारांपेक्षा उच्च टोकाचा विस्तार आहे, परंतु तो आवाज अत्यंत उच्च वारंवारतेच्या श्रेणीमध्ये केंद्रित आहे जेथे तो कमी ऐकू येईल.
    • त्रिकोणाकृती आकारापेक्षा आवाजाचे कमी टोकाचा विस्तार तयार करते, परंतु उच्च वारंवारतेमध्ये आवाज कमी केंद्रित केला जातो. तुम्ही आकाराचे डिथर दोनदा लावल्यास त्यापेक्षा दोनदा त्रिकोण डिथर लावल्यास ध्वनीच्या गुणवत्तेत किरकोळ कमी होते.
    • आयत एकतर त्रिकोण म्हणून समान ध्वनि विस्तार तयार करतो परंतु यादृच्छिकरणात अगदी कमी प्रमाणात (+/- १ बिट च्या क्रमाने) वारंवारता वितरण अगदी समप्रमाणात असते, जसे की ते पांढऱ्या आवाजाच्या जवळपास असते. इतर दोन प्रकारांपेक्षा वेगळा, आयत निरपेक्ष शांततेत आवाज जोडत नाही.

३२-बिट ध्वनीसह ऑड्यासिटीमध्ये काम करताना, डिथर सामान्यत: उच्च दर्जाच्या रूपांतरण रचनामध्ये सक्षम केले जावे (ते पूर्वनियोजितनुसार असते). जर आउटपुट मूळ माहितीपेक्षा कमी खोलीत असेल तरच डिथर लागू होईल. जास्त बिट खोली मधून लोअर बिट खोलीमध्ये रुपांतरित करताना अपरिहार्यपणे अयोग्यता असेल (कारण कमी बिट खोली कमी अचूक आहे). डिथर वापरल्याने संगीतामध्ये या अशुद्धता कमी लक्षात येण्याजोग्या होतात. बहुतेक प्रकरणांमध्ये, त्रिकोण किंवा आकाराचे डिथर व्यक्तिनिष्ठ सर्वोत्तम परिणाम देतात.

या नियमास अपवाद आहेः आपण १६-बिटमध्ये ध्वनिमुद्रण केले असल्यास आणि केवळ साधी संपादन करत असाल (कट, हटवा, पेस्ट करा, ट्रिम करा ...) आणि कोणतीही प्रक्रिया न केल्यास (वर्धित करा, समान करा, वारंवारता फिल्टर ...) सर्वात जास्त अचूकतेसाठी "काहीही नाही" वर सेट केले जाऊ शकते. या प्रकरणात, निर्यात करण्यापूर्वी ३२-बिट ऑपरेशन्स नसल्यामुळे तिथून पुढे जाण्याचा कोणताही फायदा होणार नाही. १६-बिट वर १६-बिट गीतपट्टा निर्यात करणे "एकतर नाही" वर सेट केल्याने नुकसान होणार नाही. २४-बिट गीतपट्ट्यावरुन अक्षम केलेल्या २४-बिट धारिका स्वरूपनात 24-बिट गीतपट्टामधून निर्यात केल्यास हे लागू होते.

जेव्हा जेव्हा ध्वनीवर प्रक्रिया होते तेव्हा संपूर्ण ३२-बिट (फ्लोट) वापरून सर्वोच्च गुणवत्ता प्राप्त केली जाईल. लक्षात घ्या की ३२-बिट ध्वनि धारिका १६-बिट ध्वनि धारिकेच्या दुप्पट आहेत.