搜索

首页  >  问答  >  正文

将标题重写为:使用含有多行文本、双引号和逗号的单列的CSV文件上传至MySQL

我在将数据上传到 mysql 数据库时遇到问题。

数据看起来像这样:

review_id、用户、文本

典型的行如下所示:

12345,SomeCoolName,"this is my "awsome" comment.
some more text, and dome more.
and some "more""

这应该是我表格中的一行。

由于文本字段中有多行以及使用逗号和括号,我在上传此内容时遇到问题。 关于如何处理这个问题有什么建议吗?

谢谢!

我尝试使用一些我找到的有关将 csv 文件上传到数据库的手册,但没有成功。

P粉469090753P粉469090753435 天前470

全部回复(1)我来回复

  • P粉165522886

    P粉1655228862023-09-17 00:57:56

    演示示例。

    必须导入的源 CSV 内容:

    review_id,user,text
    123,John,This is
    multiline 1, which
    contains a comma.
    456,Jim,This is
    miltiline 2, which contains
    commas, 'quote' chars and "double quote" chars.

    此数据必须导入到的表:

    CREATE TABLE test (review_id INT, user VARCHAR(255), review_text TEXT);
    

    将数据加载到表中的查询:

    LOAD DATA INFILE 'C:/ProgramData/MySQL/MySQL Server 8.0/Uploads/test.csv'
    INTO TABLE test
    FIELDS TERMINATED BY '
    DELETE t1
    FROM test t1
    JOIN test t2 USING (user)
    WHERE t1.review_text < t2.review_text;
    
    ' ENCLOSED BY '' ESCAPED BY '' LINES TERMINATED BY '\r\n' IGNORE 1 LINES (@line) SET review_id = (@review_id := CASE WHEN @line REGEXP '^\d' THEN SUBSTRING_INDEX(@line, ',', 1) ELSE @review_id END ), user = (@user := CASE WHEN @line REGEXP '^\d' THEN SUBSTRING_INDEX(SUBSTRING_INDEX(@line, ',', 2), ',', -1) ELSE @user END ), review_text = (@review_text := CASE WHEN @line REGEXP '^\d' THEN SUBSTRING(@line FROM 2 + LENGTH(SUBSTRING_INDEX(@line, ',', 2))) ELSE CONCAT_WS(' ', @review_text, @line) END );

    加载后表格数据状态:

    review_id 用户 review_text
    123 约翰 这是
    123 约翰 这是多行 1,
    123 约翰 这是多行 1,其中包含逗号。
    456 吉姆 这是
    456 吉姆 这是 miltiline 2,其中包含
    456 吉姆 这是 miltiline 2,其中包含逗号、“引号”字符和“双引号”字符。

    清算:

    rrreee

    最终表数据状态:

    review_id 用户 review_text
    123 约翰 这是多行 1,其中包含逗号。
    456 吉姆 这是 miltiline 2,其中包含逗号、“引号”字符和“双引号”字符。

    回复
    0
  • 取消回复