OpenAI Audio operations#
ใช้ operation นี้เพื่อสร้างเสียง หรือถอดความ/แปลไฟล์เสียงใน OpenAI. ดูข้อมูลเพิ่มเติมที่ OpenAI.
Generate Audio#
ใช้ operation นี้เพื่อสร้างเสียงจากข้อความ prompt.
Enter these parameters: - Credential to connect with: สร้างหรือเลือก OpenAI credential ที่มีอยู่แล้ว. - Resource: เลือก Audio. - Operation: เลือก Generate Audio. - Model: เลือก Model ที่ต้องการใช้สร้างเสียง. ดูรายละเอียดเพิ่มเติมที่ TTS | OpenAI. - TTS-1: ใช้สำหรับความเร็ว. - TTS-1-HD: ใช้สำหรับคุณภาพที่สูงกว่า. - Text Input: ระบุข้อความที่ต้องการแปลงเป็นเสียง. ความยาวสูงสุด 4096 ตัวอักษร. - Voice: เลือกเสียงที่จะใช้สร้างเสียง. ฟังตัวอย่างได้ที่ Text to speech guide | OpenAI.
Options#
- Response Format: เลือกรูปแบบของการตอบกลับเสียง เช่น MP3 (ค่าเริ่มต้น), OPUS, AAC, FLAC, WAV, หรือ PCM.
- Audio Speed: ระบุความเร็วของเสียงที่สร้าง โดยมีค่าระหว่าง
0.25
ถึง4.0
(ค่าเริ่มต้นคือ1
). - Put Output in Field: ค่าเริ่มต้นคือ
data
. ระบุชื่อฟิลด์สำหรับเก็บข้อมูล binary.
ดูรายละเอียดเพิ่มเติมที่ Create speech | OpenAI.
Transcribe a Recording#
ใช้ operation นี้เพื่อถอดความเสียงเป็นข้อความ. การอัปโหลดไฟล์เสียงมีจำกัดสูงสุด 25 MB. ค่าเริ่มต้น model คือ whisper-1
.
Enter these parameters:
- Credential to connect with: สร้างหรือเลือก OpenAI credential ที่มีอยู่แล้ว.
- Resource: เลือก Audio.
- Operation: เลือก Transcribe a Recording.
- Input Data Field Name: ค่าเริ่มต้นคือ data
. ระบุชื่อ property แบบ binary ที่มีไฟล์เสียง (รองรับฟอร์แมท: .flac
, .mp3
, .mp4
, .mpeg
, .mpga
, .m4a
, .ogg
, .wav
, หรือ .webm
).
Options#
- Language of the Audio File: ระบุภาษาของไฟล์เสียงแบบ ISO-639-1 เพื่อเพิ่มความแม่นยำ.
- Output Randomness (Temperature): ค่าเริ่มต้นคือ
1.0
. ปรับความสุ่มของผลลัพธ์ในช่วง0.0
ถึง1.0
. แนะนำเริ่มที่ประมาณ0.7
.
ดูรายละเอียดเพิ่มเติมที่ Create transcription | OpenAI.
Translate a Recording#
ใช้ operation นี้เพื่อแปลเสียงเป็นภาษาอังกฤษ. ขนาดไฟล์เสียงจำกัดสูงสุด 25 MB. ค่าเริ่มต้น model คือ whisper-1
.
Enter these parameters:
- Credential to connect with: สร้างหรือเลือก OpenAI credential ที่มีอยู่แล้ว.
- Resource: เลือก Audio.
- Operation: เลือก Translate a Recording.
- Input Data Field Name: ค่าเริ่มต้นคือ data
. ระบุชื่อ property แบบ binary ที่มีไฟล์เสียงในฟอร์แมท: .flac
, .mp3
, .mp4
, .mpeg
, .mpga
, .m4a
, .ogg
, .wav
, หรือ .webm
.
Options#
- Output Randomness (Temperature): ค่าเริ่มต้นคือ
1.0
. ปรับความสุ่มของผลลัพธ์ โดยมีช่วง0.0
ถึง1.0
. แนะนำเริ่มประมาณ0.7
.
ดูรายละเอียดเพิ่มเติมที่ Create transcription | OpenAI.
Common issues#
For common errors or issues and suggested resolution steps, refer to Common Issues.