Search
Thứ 2, 25/01/2021, 13:30 PM

Kỹ sư Việt dùng AI viết 10 bài hát trong một giây

(Công nghệ) - Mô hình AI của Nguyễn Hoàng Bảo Đại được xây dựng trong hai năm, dựa trên 30.000 bài hát tiếng Việt. Chương trình có thể viết 10 bài hát trong một giây.

Kỹ sư Việt dùng AI viết 10 bài hát trong một giây

Nguyễn Hoàng Bảo Đại sinh năm 1994 và là một trong những kỹ sư đặc biệt trong cộng đồng AI Việt Nam. Anh vừa có thể lập trình, lại có thể sáng tác và biểu diễn âm nhạc.

Đam mê âm nhạc từ nhỏ nhưng đứng trước lựa chọn quan trọng của cuộc đời, Bảo Đại không thể tiếp tục theo đuổi ước mơ mà chuyển hướng sang học về Công nghệ Thông tin. Năm 24 tuổi, anh cùng đồng đội giành giải nhất cuộc thi Zalo AI Challenge trong thử thách nhận diện giọng nói. Hai năm sau, Bảo Đại tự xây dựng mô hình "AI sáng tác nhạc" của riêng mình.

Con đường dẫn đến AI

Mùa hè cuối cùng trong thời học sinh - năm 2012, Đại cùng bạn bè đứng trước lựa chọn quan trọng đầu tiên của cuộc đời: chọn ngành và trường đại học. "Ước mơ lâu nay của mình là Nhạc viện, nhưng khi nói dự định ấy với người thân, mình không nhận được bất kỳ sự ủng hộ nào, kể cả thầy cô", chàng trai 9x nhớ lại.

Bảo Đại kể: "Lúc đó mọi người đều nghĩ rằng nếu đi theo đường nghệ thuật, sau này sẽ rất cực và khó tiến thân. Trong khi mình học tốt toán, tại sao lại bỏ lỡ? Ngay cả mẹ cũng ngăn cản lựa chọn theo học Nhạc viện. Mình hoàn toàn mất phương hướng và hoang mang vô cùng trước ngưỡng cửa đầu đời".

Không thể thuyết phục được thầy cô, gia đình, nhưng cũng không biết lựa chọn ngành học nào, Đại hỏi cậu bạn thân thi gì và nộp hồ sơ thi chung để sau này "học chung cho vui". Cuối cùng, Bảo Đại thi vào ngành Công nghệ Thông tin của Đại học Khoa học Tự nhiên.

Kỹ sư Việt dùng AI viết 10 bài hát trong một giây
Nguyễn Hoàng Bảo Đại hát "Dân IT" trong Lễ trao giải Tech Awards 2019 tại TP HCM. Anh đã trở thành gương mặt quen thuộc trong các cuộc thi, về AI của Việt Nam.

"Lúc đó mình nghĩ Công nghệ Thông tin cũng hay, chắc là học về word, excel, Photoshop rồi những thứ trên chứ không hề có một chút khái niệm nào về ngành này. Mình cũng càng không thể ngờ quyết định đó lại đưa mình đến với AI như bây giờ", Bảo Đại nói. Khi biết kết quả, cậu bạn thân của Đại lại trượt, chỉ một mình cậu đỗ. Đại lại một lần nữa mất phương hướng, dò dẫm bước vào tương lai của mình.

Hai năm đại cương trên giảng đường đại học là quãng thời gian dài vô tận với một người mất định hướng như Đại. "Đến năm thứ 3, mình bắt đầu được học về trí tuệ nhân tạo, học máy. Lúc này mình thấy thích thú vô cùng vì nó hoàn toàn mới mẻ, có thể nghiên cứu, sáng tạo nhiều thứ. AI lúc ấy như vị cứu tinh của đời mình", Bảo Đại nhớ lại.

Đại mê say nghiên cứu về AI, máy học, dù lúc đó chưa thực sự biết sau này có thể ứng dụng vào việc gì. Song song đó, anh tiếp tục nuôi dưỡng đam mê âm nhạc bằng cách theo học các khóa học chuyên sâu bên ngoài.

Kết thúc bốn năm đại học, Bảo Đại lại đứng trước lựa chọn quan trọng tiếp theo của cuộc đời - chọn công việc mình muốn gắn bó. "Lúc đó mình vẫn không biết sẽ trở thành kỹ sư hay nhạc sĩ. Cuối cùng, mình chọn đi làm trong lĩnh vực công nghệ nhưng vẫn tiếp tục giữ đam mê âm nhạc, tiếp tục sáng tác", Đại nói. Một trong những dấu ấn nổi bật nhất của anh trong vai trò "kỹ sư âm nhạc" là ca khúc Dân IT được cộng đồng trẻ đón nhận rộng rãi.

Năm 2015 - 2016, khi AI bắt đầu rộ lên, máy học đạt được nhiều thành tựu đáng kinh ngạc, Bảo Đại cũng bắt đầu nghiên cứu về các mô hình AI trên thế giới. "So với lĩnh vực hình ảnh, AI về âm thanh, đặc biệt là âm nhạc ít được quan tâm hơn. Mình nghĩ AI có thể vẽ tranh thì 'nó' cũng có thể viết nhạc. Vì vậy, mình bắt đầu ấp ủ dự định về một mô hình AI viết nhạc cho người Việt và theo thị hiếu của người Việt".

Mỗi ngày đàn 300 bài hát để huấn luyện AI

Khi nghiên cứu về các mô hình AI trong âm nhạc đang được xây dựng trên thế giới, Bảo Đại đúc kết ba mô hình có thể tạo được nhạc: Mạng neuron truyền thẳng; vanilla RNN (mạng neuron hồi quy) và Transformer. Tuy nhiên, nhược điểm của những mô hình này là sáng tác nhạc cổ điển, khác rất nhiều với thị hiếu nghe nhạc của người Việt là những bản nhạc nhẹ, nhạc Pop. "Hơn nữa, những mô hình này vẫn còn một số hạn chế, như nhiều quãng nghịch, nghe chói và không bắt tai. Mình nghĩ, nếu cứ chờ, sẽ không biết đến bao giờ mới có một mô hình AI viết nhạc cho người Việt. Nếu muốn nhanh, chỉ có cách tự mình xây dựng một thuật toán cho riêng mình", Bảo Đại nói.

Tuy nhiên, việc xây dựng một mô hình AI không đơn giản, hầu hết các sản phẩm AI đều thuộc các công ty công nghệ hoặc viện nghiên cứu. Ngoài vấn đề về kinh phí, nhân lực, hai thách thức lớn nhất với bất kỳ ai làm về AI là dữ liệu đầu vào để huấn luyện máy học và phải có một hệ thống máy tính lớn để làm các thuật toán.

"Cá nhân mình khó tự lắp đặt được một dàn máy. Vì vậy, mình tìm đến phương án cloud computing - dùng dịch vụ máy ảo và trả tiền theo nhu cầu sử dụng. Khó khăn tiếp theo là dữ liệu đầu vào, vì dữ liệu âm nhạc, đặc biệt là nhạc Việt không có sẵn trên Internet như hình ảnh hay giọng nói", Đạt kể.

Kỹ sư Việt dùng AI viết 10 bài hát trong một giây

Bảo Đại trình diễn ca khúc do AI viết nhạc tại Diễn đàn Công nghệ trong kỷ nguyên kết nối mới, bên thềm Tech Awards 2020 tại TP HCM ngày 8/1.

Mô hình Đại dùng để huấn luyện AI là Encoder - Decoder kết hợp thuật toán Attention và một vài công cụ cho nhạc pop Việt Nam. Để máy đọc được các giai điệu, dữ liệu đầu vào phải là file ở định dạng Midi. Anh giải thích: "Có thể hiểu nôm na rằng một bài hát hoàn chỉnh cũng như một . Mình ăn thấy ngon nhưng rất khó để biết được trong đó có những nguyên liệu, gia vị nào, liều lượng ra sao. Máy móc nghe nhạc ở định dạng Wav, Mp3... sẽ không thể tự tách hoà âm, phối khí ra để lấy giai điệu nên phải dùng nhạc định dạng Midi".

Khó khăn tiếp theo là âm nhạc định dạng Midi trên Internet rất hiếm. Bảo Đại phải "lang thang" khắp các diễn đàn âm nhạc để thu thập các bản nhạc, nhưng vẫn không đủ dữ liệu. Cuối cùng anh phải tự nghe đi nghe lại các bài hát và đàn lại để lấy dữ liệu cho máy học. "Các bài hát mới, được yêu thích thì không có ngay file Midi trên Internet, nên mình phải tự đàn giai điệu, chuyển hết về nốt Đô trưởng và La thứ. Công đoạn này có thể hiểu nôm na là chuẩn hoá dữ liệu trước khi đưa vào mô hình cho AI học".

Kỹ sư Việt dùng AI viết 10 bài hát trong một giây
Mô hình AI của Bảo Đại là dự án cá nhân, toàn bộ chi phí đều do anh tự trang trải.

Đến nay kho dữ liệu của Bảo Đại có khoảng 30.000 bài hát, trong đó 60% là do anh tự đàn. Trong hai năm ròng rã, anh đã đàn gần 18.000 bài hát. Có những ngày, Đại chỉ nhốt mình trong phòng và đàn từ sáng đến đêm để lấy dữ liệu cho máy học. "Ngày cao điểm mình đàn đến 300 bài hát, chỉ ăn và đàn", Bảo Đại kể.

Sau hai năm xây dựng, mô hình AI này đã có thể viết được 10 bài hát trong vòng một giây. AI sáng tác nhạc của Đại hoạt động theo mô hình: Nhạc sĩ "mớm" cho máy 3 - 5 nốt nhạc, sau đó, AI sẽ tự hoàn thiện, đưa ra một bài hát hoàn chỉnh. Theo Bảo Đại, điều đặc biệt của mô hình AI này là người dùng chỉ cần chọn một giai điệu ngắn muốn viết, sau đó bấm nút. Máy sẽ cho ra các lựa chọn khác nhau, bạn sẽ chỉ cần nghe và chọn giai điệu mình thích. Trong từng giai điệu cũng có thể tiếp tục điều chỉnh theo ý mình. Nếu AI chưa đưa ra được kết quả như ý, có thể bắt "nó" viết tiếp đến khi nào ưng ý thì thôi. Thuật toán ngẫu nhiên trong AI cho phép tạo ra các bản nhạc không trùng nhau. Vì vậy, nỗi lo về bản quyền cũng có thể được kiểm soát bằng chính AI.

Mô hình AI này cũng không tuân theo một phong cách nhất định, vì vậy, "nó" luôn đưa ra những lựa chọn mới, không đơn điệu, một màu. Thậm chí khi nhạc sĩ không có ý tưởng nào, không đưa ra bất kỳ gợi ý nào, AI cũng có thể tự sáng tác nhạc theo ý muốn của "nó".

"Ngày xưa, khi nghe những bản nhạc do máy móc sáng tác, mọi người có thể nhận ra ngay. Nhưng bây giờ, với lượng dữ liệu ngày một lớn, thuật toán ngày càng thông minh, khác biệt giữa nhạc do AI viết và nhạc do người viết đã không còn rõ ràng. Một ngày nào đó khoảng cách này sẽ bị xoá mờ", Bảo Đại khẳng định.

Định kiến và niềm tin AI

Khác với hình dung của mọi người về việc sáng tác, nhạc sĩ thường mất rất nhiều thời gian để viết phần giai điệu. Có khi mỗi ngày chỉ viết được vài giai điệu, hôm sau nghe lại thấy không hay lại bỏ đi. Việc này cứ lặp đi lặp lại khiến một bài hát có thể phải sáng tác trong 5 - 6 tháng. Nhưng với mô hình AI, nhạc sĩ có thể rút ngắn công đoạn này, thay vì viết, mình chỉ việc bấm nút, nghe, lựa chọn và điều chỉnh cho giai điệu đúng với ý mình. Thời gian còn lại có thể chăm chút nhiều hơn cho phần hoà âm, phối khí, viết lời. Đây đều là những yếu tố quan trọng, hình thành nên một bài hát hay chứ không chỉ là viết giai điệu.

Khi AI đã "thành hình" và có thể sáng tác, Bảo Đại khoe thành quả này với bạn bè trong cả giới nghệ thuật lẫn IT. Nhưng trái với những háo hức ban đầu, anh lại nhận về "gáo nước lạnh" từ cả bạn bè lẫn thầy cô của mình.

"Một nửa đón nhận, nhưng nửa còn lại thì không. Thầy dạy sáng tác của mình không thẳng thắn từ chối, nhưng cho rằng việc nhạc sĩ không viết nhạc, chỉ ngồi bấm nút và lựa chọn thì không phải là sáng tạo theo nghĩa truyền thống. Mình rất buồn, hụt hẫng, khi nhận về những phản hồi như thế", "cha đẻ" của mô hình AI viết nhạc . Tuy nhiên, cũng có nhiều người thích thú và ủng hộ mô hình này.

Những lúc hoài nghi về lựa chọn của mình, Đại thường nghĩ lại mục tiêu ban đầu là kết hợp AI với âm nhạc. Đây không chỉ là một sản phẩm mà còn là ước mơ và lý tưởng anh theo đuổi lâu nay. "Dù sao lĩnh vực này còn quá mới. Thế giới cũng đang tìm cách giải quyết các bài toán, vì vậy mình sẽ tiếp tục", 9x chia sẻ.

"Cha đẻ" của mô hình "AI viết nhạc" tin rằng bản chất của AI vẫn là giúp con người giải quyết những công việc tiêu hao nhiều thời gian, công sức. Con người vẫn phải chịu trách nhiệm cuối cùng về sản phẩm mình làm ra. Hiện tại AI vẫn còn rất thô sơ, mới chỉ viết được phần giai điệu, nhưng phần giai điệu này vẫn chưa phải xuất sắc, nhạc sĩ vẫn phải điều chỉnh, tham chiếu, lựa chọn. Vì vậy, những người viết nhạc cũng không cần lo lắng về việc AI sẽ lấy đi công việc của mọi người, hay sáng tác nhạc bằng AI sẽ làm mờ đi bản sắc của người .

Những người làm AI như Bảo Đại vẫn tin rằng mỗi cuộc cách mạng về khoa học công nghệ đều lấy đi một lượng công việc nhất định, nhưng cũng sản sinh ra một lớp việc mới. Những người làm nghệ thuật, nhạc sĩ, cũng như những nghệ nhân, sẽ luôn có chỗ đứng với những sản phẩm chất lượng cá tính, mang bản sắc riêng. AI sẽ hiện hữu khắp ngõ ngách cuộc sống. Nhưng dữ liệu AI học được là từ con người, nhạc sĩ vẫn luôn có thể sáng tác ra những giai điệu, bài hát mới mà AI chưa thể học theo.


 

Điện thoại

Apple sẽ bán riêng cáp sạc nhanh cho iPhone 15 Pro
Cáp USB-C dành cho iPhone 15 Pro sẽ có độc dài 0,8m, hỗ trợ sạc và truyền dữ liệu siêu...
 
Mẫu iPhone giá rẻ nhất của Apple chính thức lên kệ tại Việt Nam
Sau khoảng một tháng mẫu iPhone 13 xanh “rừng thông” lên kệ tại Việt Nam, người dùng trong nước tiếp...
 
7 smartphone rẻ nhất 2021 giá chỉ khoang hơn 2 triệu đồng
Các smartphone tầm giá 2 triệu đồng ra mắt năm nay đều hỗ trợ 4G, pin lớn, camera AI, cấu...
 
Chi tiết Vsmart Aris giá 7.5 triệu: Mặt lưng kính nhám, hiệu năng ổn, chỉ tiếc màn hình 'giọt nước'
Vsmart Aris với mức giá 7.5 triệu đồng đánh dấu sự trở lại của thương hiệu smartphone Việt ở phân...

Máy tính bảng

iPad lần đầu được sản xuất ở Việt Nam
Một phần dây chuyền lắp ráp iPad được chuyển tới Việt Nam, đánh dấu lần đầu thiết bị này được...
 
Apple bất ngờ ra mắt hai mẫu iPad mới
Sau khi đăng thông báo 'be right back' trên website, Apple công bố iPad Mini và iPad Air thế hệ...
 
iPad Pro 2018 sẽ mỏng chỉ 5,9 mm
Máy tính bảng thế hệ mới của Apple, dự kiến ra mắt cuối tháng 10, sẽ có thiết kế mỏng...
 
Đánh giá chi tiết iPad 9,7 inch (2018)
Mẫu iPad 9,7 inch năm nay đã có giá bán vừa tầm hơn, cấu hình mạnh hơn và hướng tới...
CEO JPMorgan cảnh báo: Fed có thể sẽ tăng lãi suất thêm 0,75%, vẫn chưa khép lại lộ trình thắt chặt chính sách
CEO của JPMogarn, Jamie Dimon, cho biết trong một cuộc phỏng vấn rằng có khả năng Fed sẽ tăng lãi...
 
4 con giáp sinh ra là những ngôi sao may mắn, đi đến đâu cũng được quý nhân phù trợ, càng về già càng ngập tràn phúc lành
Nhờ được phúc lành vây quanh, 4 con giáp này vượt qua được nhiều gian khó trong cuộc đời.
 
3 tuổi hạn cực xấu năm Giáp Thìn 2024, 1 tuổi đại nạn đề phòng mất cả cơ ngơi
Bước sang năm 2024, có 3 tuổi này rất đen đủi, cần thận tiền bạc thất thoát.
 
5 Cách giúp Thu hút Tài Lộc và Thành Công trong cuộc sống
Rất nhiều người đang tìm kiếm những cách để tạo ra sự thịnh vượng và may mắn trong cuộc sống...
 
5 tiêu chí xây dựng một mối quan hệ hòa thuận trong hôn nhân.
Hôn nhân là một cuộc hành trình đầy cảm xúc, sự gắn kết và sự trưởng thành.
 
3 con giáp là ‘chúa tiêu hoang’, không giỏi tính toán nhưng chẳng bao giờ lo hết tiền
Những con giáp này không được giỏi trong việc quản lý chi tiêu. Họ thích gì sẽ mua, muốn gì...
Delectech ra mắt Tính Năng Mới cho Seotobo: Viết Nội Dung Tự Động giúp SEO đỉnh cao
Trong thời đại mà trí tuệ nhân tạo (AI) ngày càng trở thành xu thế, việc tích hợp AI vào...
 
MART24H – NƠI KẾT NỐI TRIỆU TRÁI TIM YÊU THƯƠNG
Ngày 10/01/2021 vừa qua, Công ty Cổ phần Mart24h cùng với Hành Trình Kết Nối Yêu Thương Việt Nam đã...
 
Maritime Bank trao 4 cây vàng cùng hàng nghìn quà tặng  cho các khách hàng may mắn
Tháng 1/2018, Maritime Bank đã trao thưởng 4 cây vàng cùng 27 chỉ vàng đầu tiên của chương trình “Lộc...
 
Thị Phần Lò Đốt Rác của các Hãng tại Việt Nam
Những năm qua để giải quyết bài toán về xử lý rác thải nông thôn thì phương án mua lò...
 
Tuyển dụng trưởng phòng vé & trưởng nhóm quản lý bảo trì máy bay
Hãng hàng không Eastar Jet Co., Ltd tại Hàn Quốc tuyển dụng
 
Nike giảm giá 30% tất cả các sản phẩm nhân dịp Quốc Khánh
Từ 31/08 đến 01-09 hệ thống Nike Việt Nam có chương trình ưu đãi giảm giá cực lớn dành cho...

Kinh nghiệm-Thủ thuật

Cảm thấy chiếc iPhone của mình ì ạch bất thường, đây là cách bạn có thể tăng tốc nó dễ dàng
Nguyên nhân iPhone ì ạch hoàn toàn có thể đến từ việc máy lưu trữ quá nhiều dữ liệu bộ...
 
Hướng Dẫn Tạo Ảnh SVG Động Trên Svganimation.net
Bạn có thắc mắc về SVG và chưa tìm được lời giải đáp? Việc hiển thị hình ảnh trên các...
 
Cải Thiện Kỹ Năng Qua Việc Làm Bài Trắc Nghiệm Online
Bạn có biết rằng việc làm bài trắc nghiệm online không chỉ giúp cải thiện kỹ năng học tập, mà...
 
App lừa đảo trên iPhone dụ người dùng đo nhịp tim với giá 90 USD
Một ứng dụng trên App Store đã lợi dụng Touch ID trên những chiếc iPhone để lừa người dùng thanh...
Top
Điện thoại:

Tiếp thị & Tiêu dùng - tiepthitieudung.com. All Right Reserved
Tiếp thị & Tiêu dùng - Cập nhật thông tin mới nhất về giá cả, thị trường, mua sắm...
tiepthitieudung.com giữ bản quyền trên website này
Liên hệ: [email protected]

2.41991 sec| 2010.055 kb