洞察焦点
· 我们已经使用机器学习来研究商品市场结构。
· 我们的算法揭示了商品之间的关系。
· 糖和可可之间有很强的正相关关系,而糖和乳制品之间则是负相关关系。
在商品中使用机器学习
分析不同市场之间的关系是困难的。一般来说,通常只有是在行业中长期任职的专家才比较了解关于市场结构的知识。而我们目前已经使用机器学习来帮助理解其中的一些关系。
在研究不同商品之间的关系时,人们倾向于看相对回报或价格。这是有效的,但不一定能捕捉到大宗商品之间更深层次的关系。这些关系也常常会被数据中的短期波动所掩盖。为了解决这个问题,我们专注于价格趋势之间的相关性,使用动态趋势检测算法来识别2周到6个月的窗口内最重要的趋势。然后,通过聚类法分类出有共同趋势的商品组,聚类是一种在数据集中发现组的机器学习过程。
揭示商品市场之间的关系
我们的算法确定了以下商品组:
· 组 1:谷物
· 组 2:乳制品
· 组 3:石油和能源
· 组 4:糖
· 组 5:棉花和咖啡
在这张热图中可以观察到,其中数值表示相关系数,颜色表示相关程度——表中的颜色越深,相关性越高。
基于此,算法似乎对商品进行了逻辑分割。一些商品之间具有明确基本关系,如第三级别的牛奶和奶酪,具有较强的相关关系。
该算法还显示了这些关系的大小。放大大豆的位置,我们可以看到大豆和豆粕具有较强的相关关系,但豆油与两者的相关关系很弱。
有趣的关系——可可和原糖的价差,乳制品和糖的关系?
数据中有几个不太明显的关系。
例如,原糖和可可之间的相关性几乎和原糖和白糖之间的相关性一样重要(甚至比原糖与乙醇的关系更强)。也许除了原白糖价差,我们还应该注意可可和原糖(巧克力?!)的价差?
我们也可以关注负相关关系。我们的分析表明糖和奶制品是高度负相关的。也许如果食糖价格上涨,食品制造商可能会增加乳脂(使用更多的第四级别乳制品),同时降低甜度以控制成本?
相关性之上
在下一篇文章中,我们将以这种技术为基础,更详细地研究俄乌战争是如何影响商品市场的。