ホームページ > 記事 > テクノロジー周辺機器 > トランプ大統領暗殺写真の値段は2100元? ! 記事のタイトル、添付写真、AI が 12 件を無料で提供します
Machine Power Report
Editor: Sia
Big model replaces the editor assistant, and is more reliable than Carrot Run as a driver. Much more.
It is said that self-media uses photos of Trump’s assassination as illustrations and charges 2,100 yuan per picture!
The days of just taking a picture to illustrate an article are gone forever.
However, the creators’ troubles did not end there.
After writing a public account article, the next ten minutes are the most head-scratching:
Title shop, prime location, every inch of land is valuable. In addition to highlighting the highlights of the content, you also need to ensure that the title is attractive enough to click and read. This is much more difficult than writing an article!
What? The aroma of wine is not afraid of the deep alley?
In the Red Sea public account circle, this doesn’t work.
Don’t be discouraged either! After running in for a while, we found that the large model is quite effective in solving these two daily challenges.
-1-
Create a qualified title in the shortest time
For the convenience of chatting, let’s take this reporton the new robot basic model company Skild AI as an example.
If you know the highlights that need to be highlighted in the article, but you just don’t know how to create an attractive permutation and combination, you might as well tell the big model:
1. This is an article for a WeChat official account and needs an attractive title. ;
2. The title should highlight the data advantages, financing amount and robot GPT
This is Claude 3.5 sonnet’s idea, not bad!
Can’t even figure out what the highlights are?
Then let the big model help you find it first, and then let him or her focus the found highlights on the title.
Claude 3.5 sonnet’s ability to summarize is very good.
Don’t even bother to think about the highlights? Then just "follow the gourd and draw the scoop"!
Some people say they like the title of "This Site" style. Wait, what does that smell like? We haven’t really counted it yet.
Let the big model analyze it: technology and big IP should be prominent and eye-catching...
Hmm, it seems like this.
gave several similar titles to the new reports. It really has an internal flavor, and the first three can be used almost directly, except that they are a bit long.
What if you prefer Weibo hot search style titles?
We take the hot searches at a certain time on July 15 as input and let the large model analyze the characteristics of these hot search titles.
接下来也给这篇文章起一个热搜风格的标题。是不是还可以?至少,咱有了进一步改善的基础方案(万事开头难呐):
还可以要求更多备选:
有人喜欢专业、严肃的财经媒体标题风格,安排上。
我们集合了三年《财新周刊》封面报导标题,让 Claude 3.5 sonnet 分析。
短、双关、重大话题、问题导向......,几个要点都抓到了:
这是大模型为咱们这篇报道起的几个标题。
内什么,前三个标题的风格,是不是确有几分相似?
-2-
模仿生图,AI 主打一个省
为了避免版权纠纷,越来越多的人开始用 AI 生成文章的封面。
很多时候,比起让 AI 毫无头绪地天马行空,我们更希望 TA 直接模仿一些现成图片。
一般,我们会先让大模型看图说话,给出提示词,再将这些提示词扔给图片生成器。
这是一位同事的真实体验:
如果发现提示词不好使,可以让大模型( Claude 3.5 sonnet )「仔细描述图片细节和内容」:
然后,将这些描述扔给图片生成器:
这张图片展示了一个独特而富有对比的场景:
背景:图片背景是一面灰色的混凝土墙,看起来质感粗糙,有些斑驳和纹理。
座席:图片中央有一个简单的黑色长凳或平台,看起来也是由混凝土或某种硬质材料制成。
人物:一个年轻男子坐在长凳的右侧。他穿着深色西装和高领毛衣,戴着黑框眼镜。他的姿势很放松,双手放在腿上。
机器人:在长凳的左侧,坐着一个小型白色机器人。这个机器人有一个圆形的头部,上面有红色的眼睛状灯光。它的身体上有一些彩色的装饰,看起来像是控制面板。
光线:图片的光线很有特点,从右侧打来,在墙上和地上投下了人和机器人的阴影。这种光影效果增添了图片的戏剧性和深度。
氛围:整个场景给人一种未来主义和科技感的氛围。人类和机器人并排而坐,似乎在暗示人机共存的未来。
构图:图片构图简洁有力,左右对称,中间留有空白,增强了人与机器人之间的对比和联系。
这张图片通过简洁而富有寓意的场景设置,巧妙地展现了人类与人工智能共处的主题,引发了对未来科技发展的思考。
もちろん、を使用することもできますKuaishou 独自に開発した文盛図の大型モデルが期間限定で無料公開されており、評判も良いです。
ただし、大規模なグラフ化可能なモデルは DALL-E-3 とは異なり、Claude 3.5 ソネットによって生成される大量の記述コンテンツを消化できません。
したがって、「クリエイティブ概要」に入るときは、短縮して変更する必要があります:
シンプルな黒いベンチと、ベンチの右側に若い男性が座っています。彼はダークスーツとタートルネックのセーターを着て、黒縁のメガネをかけて、ベンチの左側に赤い目のようなライトが付いた丸い頭を持つ小さな白いロボットを座らせていた。ボディにはコントロールパネルのようなカラフルな装飾が施されています。写真の中の光は非常に特徴的で、右側から差し込み、壁や地面に人やロボットの影を落としています。
次に「画像をパディング」し、類似度を調整して結果を生成します:
ただし、この写真の場合、効果は非常に貧弱です。
人や機械が突然増えていることに加えて、キャラクターの1つをよく見ると、そのキャラクターがレゴのような顔をしていることがわかります。
最近、テクノロジーメディアのThe Vergeは、デヴィッド・ボウイ、U2、コールドプレイなどの音楽プロデューサーであるブライアン・イーノが主人公の初のジェネレーティブ伝記映画について報じた。
このムービーを再生するたびに、ムービー素材が特別なアルゴリズムに従って再結合されるため、毎回異なるものが表示されます。
このコラージュ スタイルのカバー デザインは、映画のテーマによく応えており、伝記的人物の多用途性も示しています。
まず、Claude 3.5 ソネットに画像を注意深く記述させ、次にその記述を DALL-E-3 に投げて画像を生成しました。
なんと言いますか?すっきりしていて少し寂しい感じです。
クロード3.5ソネットの説明を一文にまとめ、大きな模型に投げ込み、その上に写真を載せました。
今回は明らかにケートゥの効果が良くなりました。
The Economist の創造的でユニークな表紙も真似てみました。
今回は、DALL-E-3 (右上) よりも Tutu (右下) の視覚効果が優れています。ただし、スペルが悪いと結果が台無しになりました。
同様のスタイルを生成するために DALL-E-3 を使用しましたLLM を表現する写真は、個人のプライバシーとデータに対する脅威となります。
-3-
テキストと指
は依然として画像ジェネレーターの弱点です
これまでの事例から次のことが分かりました:
画像に単語とテキストが含まれなければならない場合、TAはそれを行うのが困難になります。やれ!
ご存知のとおり、Ketu は依然として OpenAI のスペルを間違えており、DALL-E-3 も頻繁に同じことをします。
DALL-E-3 の写真に「Siemens」を正しく表示するのは、英語でも中国語でも非常に困難です。
Siemens Industrial Copilot に関する画像を生成してください。2 つのキーワードも間違っています。
指の詳細が含まれることは以前からわかっていましたが、画像生成器には依然として問題が発生しやすいです。
でも、花が鼻をほじるような絵ですら成功するのが難しいとは思いませんでした。
これはDALL-E-3さんの作品、本当に「すごい」です。
ケートゥに銃を投げたとき、TA は難しい立場にあり、恥ずかしくて鼻の穴の前に指を置くことができませんでした:
彼の手に持っている銃については、そうですね、指が 6 本しかありませんでした:
これは驚くべきことではありません。
画像ジェネレーターは通常、拡散モデルを使用してノイズから画像を再構成し、より多くのピクセルをカバーするパターンを学習します。当然のことながら、テキストや指などの詳細を生成する際のパフォーマンスは低くなります。
もちろん、これは、テキスト ジェネレーターがスペル マスターでなければならないという意味ではありません。画像ジェネレーターとテキスト ジェネレーターの背後にある基盤テクノロジーは異なりますが、スペルやその他の詳細に関しては同様の困難があります。
結局のところ、私たちは物理世界と言語世界の基本的な常識がまだ不足しています。
以上がトランプ大統領暗殺写真の値段は2100元? ! 記事のタイトル、添付写真、AI が 12 件を無料で提供しますの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。