Rumah  >  Artikel  >  pembangunan bahagian belakang  >  Ketidakpastian Pakej `mime` dalam Go: Percaya Tetapi Sahkan

Ketidakpastian Pakej `mime` dalam Go: Percaya Tetapi Sahkan

WBOY
WBOYasal
2024-07-29 07:26:131199semak imbas

Indeterminacy of the `mime` Package in Go: Trust But Verify

Disiarkan pada asalnya dalam blog saya: https://lazy.bearblog.dev/go-mime-wtf/

Latar belakang

Pada suatu hujung minggu, saya memutuskan untuk menulis bot Telegram untuk diri saya sendiri untuk mengautomasikan senarai tugasan atau beli-belah.

Ideanya mudah sahaja. Saya menghantar bot senarai item untuk dibeli dan ia membuat halaman web dengan kotak pilihan yang boleh saya tandai sambil memegang telefon saya dalam satu tangan dan bakul beli-belah di tangan yang lain.

Bot itu ditulis dengan agak pantas, tetapi kemudian saya ingin mencuba model Whisper OpenAI. Jadi, saya memutuskan untuk menambahkan pengecaman pertuturan pada aplikasi saya.

Kini, program ini berfungsi seperti berikut:

  • Saya menghantar bot mesej suara seperti ini: "beli sekilogram kentang, sekumpulan dill, seketul kubis, sepasang bir, oh, tidak perlu kubis, kami ada"
  • Bot mengenali pertuturan dan mencipta halaman dengan kotak pilihan:
[ ] potatoes - 1 kg
[ ] dill - 1 bunch
[ ] beer - 2 bottles

Sekarang, mengenai artikel itu. Dalam go-openai, anda boleh menghantar audio menggunakan struktur openai.AudioRequest, yang membolehkan anda menentukan aliran data audio dalam medan Pembaca atau laluan fail dalam medan FilePath. Nah, saya fikir medan ini saling eksklusif, tetapi ternyata anda perlu menentukan FilePath walaupun semasa menggunakan aliran audio. API mungkin menggunakan ini untuk menentukan jenis strim.

Di sisi Telegram, kami menerima struktur tgbotapi.Voice, yang mempunyai medan MimeType. Untuk mesej suara, ia adalah audio/ogg, tetapi ia boleh berubah dengan mudah pada masa hadapan.

Jadi, kami mempunyai jenis MIME aliran audio, dan kami perlu menentukan sambungan fail daripadanya, mencipta nama fail untuk memastikan API OpenAI tidak mengadu tentang jenis fail yang tidak diketahui.

Apa yang Lebih Mudah?

Kod itu nampak remeh:

extensions, err := mime.ExtensionsByType(mimeType)
if err != nil {
    return err
}
if len(extensions) == 0 {
    return fmt.Errorf("unsupported mime type: %s", mimeType)
}
ext := extensions[0]
log.Printf("Assumed extension: %s", ext)
fakeFileName := fmt.Sprintf("voice_message.%s", ext)

Menguji secara tempatan - ia berfungsi:

2024/07/28 17:49:06 Assumed extension: oga

Memasang ke awan - ia tidak berfungsi:

2024/07/28 17:55:32 unsupported mime type: audio/ogg

Menyemak versi Go, secara tempatan dan dalam CI/CD yang digunakan untuk membina - ia adalah sama.

Mari Bercuti untuk Mengejar

Ternyata kelakuan pakej mime tidak menentukan dan bergantung pada masa jalan sama ada terdapat fail /etc/mime.types dalam sistem pengendalian dan kandungannya.

Di situlah pakej mime membaca jadual masa jalan jenis MIME kepada pemetaan sambungan fail.

Saya sangat serius: anda menyusun binari, jalankan semua ujian, semuanya kelihatan hebat, tetapi binari ini akan menentukan sambungan fail yang diandaikan untuk jenis MIME yang sama secara berbeza dalam persekitaran yang berbeza.

Cara Memperbaikinya

Mari kita ambil jenis MIME fail audio dan sambungannya dan tambahkannya secara manual dalam fungsi init menggunakan mime.AddExtensionType.

var mimetypes = [][]string{
    {"audio/amr", "amr"},
    {"audio/amr-wb", "awb"},
    {"audio/annodex", "axa"},
    {"audio/basic", "au", "snd"},
    {"audio/csound", "csd", "orc", "sco"},
    {"audio/flac", "flac"},
    {"audio/midi", "mid", "midi", "kar"},
    {"audio/mpeg", "mpga", "mpega", "mp2", "mp3", "m4a"},
    {"audio/mpegurl", "m3u"},
    {"audio/ogg", "oga", "ogg", "opus", "spx"},
    {"audio/prs.sid", "sid"},
    {"audio/x-aiff", "aif", "aiff", "aifc"},
    {"audio/x-gsm", "gsm"},
    {"audio/x-mpegurl", "m3u"},
    {"audio/x-ms-wma", "wma"},
    {"audio/x-ms-wax", "wax"},
    {"audio/x-pn-realaudio", "ra", "rm", "ram"},
    {"audio/x-realaudio", "ra"},
    {"audio/x-scpls", "pls"},
    {"audio/x-sd2", "sd2"},
    {"audio/x-wav", "wav"},
}

func init() {
    log.Println("init mimetypes")
    for _, v := range mimetypes {
        typ := v[0]
        extensions := v[1:]

        for _, ext := range extensions {
            err := mime.AddExtensionType("."+ext, typ)
            if err != nil {
                log.Fatalf("mime: %s", err.Error())
            }
        }
    }
}

Ini akan menjadikan gelagat aplikasi kami deterministik mengenai domain yang akan berfungsi dengannya (dalam kes saya, fail audio).

Kesimpulan

Pengalaman ini menunjukkan bahawa perkara dalam Go tidak selalunya bersifat deterministik. Jika sesuatu kelihatan ganjil, jangan teragak-agak untuk menyelami kod sumber perpustakaan dan lihat cara ia dilaksanakan. Ini boleh menjimatkan banyak masa dan masalah anda dalam jangka masa panjang.

Atas ialah kandungan terperinci Ketidakpastian Pakej `mime` dalam Go: Percaya Tetapi Sahkan. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn